摘要
本发明提供了一种工业自动化的控制方法、装置、设备及存储介质,该方法包括:针对多智能体系统进行动态拓扑建模,并基于自适应聚类算法对各智能体的交互关系进行分解,得到局部动态模型。利用分布式强化学习训练各智能体的深度神经网络,输出价值网络和状态预测函数。在接收控制指令和当前系统状态后,通过状态预测函数预估未来演化,并结合价值网络构建多目标博弈优化问题,求解各智能体的纳什均衡与控制优先级。针对不确定环境引入鲁棒优化方法,为每个智能体生成可应对环境扰动的控制动作。本发明在多目标需求间实现平衡,具备高度拓扑适配能力和鲁棒控制性能,适用于工业生产中的复杂多智能体场景,实现更稳定、高效的自动化协同控制。
技术关键词
分布式强化学习
鲁棒控制
子系统
构建深度神经网络
动态
聚类算法
工业系统
关系
网络结构
控制设备
鲁棒优化方法
列生成算法
多智能体系统
拉普拉斯
邻居
在线
系统为您推荐了相关专利信息
动态知识图谱
传感器节点
高压压缩机
历史监测数据
时间序列特征
字段
关键字
数据共享方法
序列标注模型
数据共享系统
协同搜索方法
无人艇集群
全局路径规划
深度强化学习
局部路径规划
胸椎
深度卷积神经网络
腰椎
体测一体机
生成受试者