摘要
本发明提供一种基于实时产况的车间多智能体深度强化学习调度方法,涉及生产调度与工业自动化技术领域,方法包括:通过分布式传感器网络实时采集生产数据构建多维时序矩阵;建立含时间、资源、任务维度的三维决策空间,采用改进的多智能体深度确定性策略梯度算法;动态计算生产批次的实时生产紧迫度,分析跨单元协作生成协同效率因子;结合二者通过课程学习策略优化调度方案;利用虚拟孪生环境验证方案并反馈更新模型参数。本发明突破传统调度动态适应性不足、多目标协同低效等局限,实现对设备故障、订单调整等动态产况的实时响应,通过多智能体协作与闭环验证机制,平衡时间效率、能耗经济与异常容错性,提升复杂生产约束下资源协同效率。
技术关键词
多智能体深度强化学习
深度确定性策略梯度
分布式传感器网络
车间
动态
异常事件
因子
多维时序数据
多智能体协作
仿真环境
设备协同工作
工业自动化技术
滑动窗口机制
实时监测设备
指标
设备运行参数
更新模型参数
计算方法
验证机制
系统为您推荐了相关专利信息
电力电子电路
仿真方法
半导体元件
波形
晶闸管整流电路
风电机组
停机保护方法
时间序列预测模型
长短期记忆网络
轨迹
鲁棒评估方法
配电网新能源
新能源电网
两阶段鲁棒优化
包络构建方法
便携式工控机
光电系统
动态
安装误差
红外热像仪图像