摘要
本申请提供了一种基于深度强化学习的动态柔性作业车间多目标调度方法,包括以下步骤:将确定性调度问题转化为马尔科夫决策模型;基于马尔科夫决策模型,构建基于MOHDQN的确定性调度算法并设计训练过程,对算法进行训练,在随机算例上进行测试,形成确定性调度模型智能体;构建马尔科夫跳跃决策过程,并将事件驱动型预反应式调度问题转换为马尔科夫跳跃决策过程;基于HDRQN算法,构建训练过程,并与仿真环境交互训练事件驱动型预反应式调度智能体;将交互训练结果在随机算例上进行测试,形成事件驱动型预反应式调度智能体。本申请方法在求解精度和求解速度中实现最佳权衡,所提出的方法能够处理存在多种不确定性事件的复杂多目标调度问题。
技术关键词
柔性作业车间
深度强化学习
决策
工件
深度Q网络
调度算法
动态
仿真环境
计划
门控循环单元
负荷
模块
申请方法
定义
表达式
参数
比率
变量
系统为您推荐了相关专利信息
斜面角度
插针
电子连接器
轮廓数据
边缘检测算法
辅助机器人
盲人出行
AI智能控制
动态障碍物
移动机器人
协同调度方法
发电机组
有功功率
储能系统
残差网络
变压器监测方法
决策树模型
气体分析
变压器监测系统
支持向量机分类器
热量控制方法
深度学习模型
冷热水管道
热像仪
训练神经网络