一种基于策略优化DDQN算法的分层动态调度方法

AITNT
正文
推荐专利
一种基于策略优化DDQN算法的分层动态调度方法
申请号:CN202510060040
申请日期:2025-01-15
公开号:CN119987302A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种基于策略优化DDQN算法的分层动态调度方法,用于求解带批处理机的可重入混合流水车间动态调度问题,首先确定调度问题的目标函数及约束条件;然后,通过引入自注意力机制,提出一种基于自注意力机制DDQN的分层结构,构建了两个智能体,即组批智能体和调度智能体,来分别解决问题中的组批和调度子问题;此外,为了应对问题中的多阶段批量处理和重入式调度特性,设计了考虑这两个智能体特点的马尔可夫决策过程,包括状态、动作和奖励。进一步地,提出了基于掩码结合ε‑贪婪策略的动作选择策略和软启动目标网络更新策略,以提高效率和泛化能力。本发明在解决带批处理机的可重入混合流水车间动态调度问题上具有显著的效果。
技术关键词
动态调度方法 流水车间 工件 阶段 决策 代表 平均等待时间 批量 贪婪策略 分层 注意力机制 索引 软启动 算法 时间差 指数 变量 有效性
系统为您推荐了相关专利信息
1
一种基于强化学习的全局接口动态限流方法
动态限流方法 深度神经网络 模拟器 更新网络参数 梯度下降算法
2
一种基于深度学习的卫星安全通信系统
通信系统 多阶段 卫星通信场景 神经网络框架 损失函数优化
3
面向智能网联汽车协同计算的激励系统与方法
面向智能网联汽车 样本 决策 激励方法 信息接收模块
4
基于强化学习拍卖算法的多移动机器人多任务调度方法
多任务调度方法 拍卖算法 中央控制器 移动机器人执行 多任务技术
5
电池实时电量估算方法及电动叉车的仪表装置
电量估算方法 电池放电电流 仪表装置 电压采样模块 工况
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号