摘要
本发明公开了一种基于策略优化DDQN算法的分层动态调度方法,用于求解带批处理机的可重入混合流水车间动态调度问题,首先确定调度问题的目标函数及约束条件;然后,通过引入自注意力机制,提出一种基于自注意力机制DDQN的分层结构,构建了两个智能体,即组批智能体和调度智能体,来分别解决问题中的组批和调度子问题;此外,为了应对问题中的多阶段批量处理和重入式调度特性,设计了考虑这两个智能体特点的马尔可夫决策过程,包括状态、动作和奖励。进一步地,提出了基于掩码结合ε‑贪婪策略的动作选择策略和软启动目标网络更新策略,以提高效率和泛化能力。本发明在解决带批处理机的可重入混合流水车间动态调度问题上具有显著的效果。
技术关键词
动态调度方法
流水车间
工件
阶段
决策
代表
平均等待时间
批量
贪婪策略
分层
注意力机制
索引
软启动
算法
时间差
指数
变量
有效性
系统为您推荐了相关专利信息
动态限流方法
深度神经网络
模拟器
更新网络参数
梯度下降算法
通信系统
多阶段
卫星通信场景
神经网络框架
损失函数优化
面向智能网联汽车
样本
决策
激励方法
信息接收模块
多任务调度方法
拍卖算法
中央控制器
移动机器人执行
多任务技术
电量估算方法
电池放电电流
仪表装置
电压采样模块
工况