摘要
本发明公开了一种基于深度强化学习的运输约束下作业车间调度方法,包括以下步骤:获取车间调度环境数据以及车间调度订单特征数据,构建训练数据集;基于运输约束下的作业车间调度状态,构建深度强化学习模型;所述深度强化学习模型包括马尔可夫过程和调度器;根据训练数据集,利用多智能体近端策略优化算法训练深度强化学习模型;将车间调度任务输入训练后的深度强化学习模型中,输出调度结果。本发明能够快速有效地找到车间调度问题的较优解,提高了调度的效率和质量。本发明可广泛应用于工业调度技术领域。
技术关键词
作业车间调度方法
深度强化学习模型
多层感知机
异构
调度器
特征提取模块
工业调度技术
订单
注意力
策略
工件
表达式
数据
网络
节点特征