摘要
本发明提供一种基于动作相关性的深度强化学习工业决策智能构建方法,涉及深度强化学习动作相关性技术领域,首先构建工业生产过程模型以及工业决策智能体策略分层模型,然后选择训练算法对上层调度模型和下层决策模型进行训练;训练开始时上层调度模型的动作空间由下层决策模型的输出决定;对上层调度模型和下层决策模型均使用PPO算法进行训练;通过设计模型架构并对模型进行训练,得到训练完成的工业决策智能体模型,并以此进行工业决策的构建。
技术关键词
智能构建方法
实体
策略
智能体模型
参数
分类特征
构建决策模型
关键词
语义特征
训练算法
数字孪生模型
数学模型
工业生产
表格
传感器
深度强化学习算法
系统为您推荐了相关专利信息
水产品药物残留
拉曼光谱数据
机器学习算法
支持向量回归模型
修正算法
风险预警方法
对象
数据采集设备
指标
风险预警装置
参数
模型训练方法
联邦学习系统
机器可读指令
服务器
图像替换方法
图片
网格模型
输入神经网络模型
子模块
有效性识别方法
靶标
粉尘
非对称最小二乘基线校正方法
LIBS光谱探测