摘要
本发明公开了基于深度强化学习与异构图神经网络的动态调度优化方法。本发明首先将柔性作业车间调度问题转换为马尔可夫决策过程,设置状态、动作、状态转移以及奖励函数;然后构建基础异构图和增强异构图,定义节点和边的类型和数量,边之间的有向关系;采用异构图注意力网络进行三阶段特征嵌入,获得机器节点嵌入、操作节点嵌入、分配实例节点嵌入和全局状态特征;输入各个特征处理后形成的动作状态向量,根据奖励函数优化决策网络,更新参数得到柔性作业车间调度模型,完成FJSP求解。本发明方法可以有效考虑运输时间与机器可达性约束下的柔性作业车间调度问题,还可以处理不同规模的调度问题,具有较好的泛化能力,在大规模应用中表现出色。
技术关键词
动态调度优化方法
柔性作业车间调度
嵌入特征
深度强化学习
异构
决策网络模型
平均等待时间
节点特征
多层感知机
生成机器
策略
基础
物理设备
注意力
状态更新
参数
关系
系统为您推荐了相关专利信息
模糊逻辑控制器
网络分析技术
人机交互界面
注意力
建模技术
处理器
异构
共享硬件资源
计算机执行指令
操作系统启动
高速电力线载波通信
网络拓扑结构
更新系统固件
双模通信单元
负载均衡优化
多维分析系统
大语言模型
多源异构数据融合
图谱
多模态
高速数据传输系统
透镜天线
信道
收发模块
相位调节电路