摘要
本发明属于分布式车间动态调度相关技术领域,其公开了一种基于贪婪启发式增强的分布式异构车间调度方法及设备,步骤为:将待调度的分布式异构车间的状态特征输入双层端到端策略网络,双层端到端策略网络输出最优的待加工工件,继而得到最终的调度方案;其中,双层端到端策略网络的训练环境是基于部分可观测马尔可夫决策过程调度模型构建的;状态特征是基于部分可观测马尔可夫决策过程调度模型获得的;部分可观测马尔可夫决策过程调度模型是采用去中心化的多智能体架构对动态分布式异构车间调度问题进行建模得到的。本发明提高了可拓展性及灵活性。
技术关键词
车间调度方法
异构
特征提取网络
策略
工件
决策
车间调度系统
强化学习方法
强化学习算法
可读存储介质
处理器
搜索方法
调度器
动态
指令
存储器
计算机
系统为您推荐了相关专利信息
超声影像数据
辅助检查方法
大语言模型
卷积神经网络模型
全局特征提取
功率分配方法
数字孪生模型
全柔性
充电终端
功率分配策略