摘要
本发明提出一种基于多智能体强化学习的机器人集群韧性调度方法,考虑车间的复杂特征以及考虑设备故障冲击对调度系统的影响,将韧性理论融入到焊接生产调度问题中,通过加入预防性维护和纠错性维护来提升系统韧性,通过构建多智能体强化学习的算法框架使用值分解结合多智能体演员‑评论家算法对每个智能体进行信用分配,实现焊接车间韧性调度系统应对设备故障冲击的响应恢复能力。
技术关键词
多智能体强化学习
集群
调度系统
应对设备故障
指令
纠错
神经网络参数
体机器人
算法框架
焊接车间
策略更新
工件
提升系统
理论
场景