摘要
本发明公开了一种基于深度强化学习的茶叶烘干设备动态控制方法,包括如下步骤:S1、采集茶叶烘干设各控制单元的参数,生成状态观测数据集合;S2、构建设备图结构,输出设备图结构信息;S3、基于改进MADDPG算法构建包含烘干图神经网络结构的动作价值计算网络,生成全局联合特征嵌入集合;S4、构建策略网络集合,生成控制动作集合;S5、将全局联合特征嵌入集合与控制动作集合输入动作价值预测模块,输出动作价值预测结果;S6、利用改进MADDPG算法执行动作价值损失函数计算与参数反向更新;S7、将训练完成的策略网络集合部署至茶叶烘干设备控制系统中。本发明改进MADDPG与烘干图神经网络,实现茶叶烘干设备动态闭环调控。
技术关键词
茶叶烘干设备
动态控制方法
深度强化学习
控制单元
神经网络结构
物理
策略
节点
送风单元
动作融合
采集茶叶
动态更新
加热单元
参数
融合特征
算法
邻居
数据
多单元
系统为您推荐了相关专利信息
节点故障预测方法
神经网络模型
网络吞吐量
实时监测数据
历史故障数据
多功能计算机
视觉检测装置
温湿度调节装置
气动控制单元
卷积神经网络模型