一种基于策略优化DDQN算法的分层动态调度方法

正文

推荐专利

申请号：CN202510060040

申请日期：2025-01-15

公开号：CN119987302A

公开日期：2025-05-13

类型：发明专利

摘要

本发明公开了一种基于策略优化DDQN算法的分层动态调度方法，用于求解带批处理机的可重入混合流水车间动态调度问题，首先确定调度问题的目标函数及约束条件；然后，通过引入自注意力机制，提出一种基于自注意力机制DDQN的分层结构，构建了两个智能体，即组批智能体和调度智能体，来分别解决问题中的组批和调度子问题；此外，为了应对问题中的多阶段批量处理和重入式调度特性，设计了考虑这两个智能体特点的马尔可夫决策过程，包括状态、动作和奖励。进一步地，提出了基于掩码结合ε‑贪婪策略的动作选择策略和软启动目标网络更新策略，以提高效率和泛化能力。本发明在解决带批处理机的可重入混合流水车间动态调度问题上具有显著的效果。

技术关键词

动态调度方法流水车间工件阶段决策代表平均等待时间批量贪婪策略分层注意力机制索引软启动算法时间差指数变量有效性

系统为您推荐了相关专利信息

一种基于强化学习的全局接口动态限流方法

动态限流方法深度神经网络模拟器更新网络参数梯度下降算法

一种基于深度学习的卫星安全通信系统

通信系统多阶段卫星通信场景神经网络框架损失函数优化

面向智能网联汽车协同计算的激励系统与方法

面向智能网联汽车样本决策激励方法信息接收模块

基于强化学习拍卖算法的多移动机器人多任务调度方法

多任务调度方法拍卖算法中央控制器移动机器人执行多任务技术

电池实时电量估算方法及电动叉车的仪表装置

电量估算方法电池放电电流仪表装置电压采样模块工况

一种基于策略优化DDQN算法的分层动态调度方法

站点导航

APP 下载