摘要
本发明属于生产调度相关技术领域,并公开了一种基于多智能体近端策略优化算法和高效动作解码的可重构车间动态调度方法及系统。离线训练阶段:构建高层工件排序智能体、制造单元分配智能体和底层工件排序智能体,通过智能体与车间交互获得历史调度数据,基于历史调度数据和多智能体近端策略优化算法对各个智能体进行训练,将训练好的各个智能体用于在线应用;在线应用阶段:对于待加工的订单,利用离线阶段训练获得的三个智能体与车间进行多次交互,直至完成订单中所有任务的加工。相较于常用的基于生产经验的调度规则,本发明通过深度强化学习模型提供合理决策,同时能够快速响应多种扰动事件,保障了车间的高效生产和运行稳定性。
技术关键词
动态调度方法
高效动作
车间
工件
订单
决策
重构
解码
策略
基准
算法
深度强化学习模型
离线
动态调度系统
阶段
代表
执行器
在线
数据
资源
系统为您推荐了相关专利信息
实时监控系统
车间
烟雾传感器
计算机程序指令
数字孪生
风险管理方法
风险预测模型
订单
计算机可读指令
特征提取模型
效能系数
椭圆机
分布圆直径
飞轮
夹持力控制系统
精密件
加工件
工艺优化方法
工艺优化系统
微结构
反射体
测距传感器
定位器
机器人基坐标系
坐标系校准方法