摘要
本发明涉及工业生产线技术领域,且公开了一种基于强化学习的工业生产线多设备动态协同调度方法,包括以下步骤:S1、三维状态空间建模;S2、分层强化学习架构;S3、边缘‑云协同执行。该基于强化学习的工业生产线多设备动态协同调度方法及系统,通过三维状态空间建模将设备状态、任务约束、资源占用整合为结构化矩阵,全局决策层利用双向长短期记忆网络捕捉生产时间序列依赖,通过图注意力网络建模设备空间关联与工艺约束,生成包含任务分配、产能调节、资源预配的全局策略;边缘层检测动态事件后,云平台通过蒙特卡洛树搜索生成候选方案,结合全局价值网络评估任务完成时间、设备负载均衡等多目标,实现动态事件响应与多目标协同优化。
技术关键词
协同调度方法
协同调度系统
多设备
蒙特卡洛树搜索
分层强化学习
策略
动态
多模态传感器
分布式训练
工业生产线技术
采集设备
云平台
多传感器数据融合
双层网络结构
时间序列数据库
设备交互
检测异常状态