基于深度强化学习带运输时间的柔性作业车间调度方法及系统

正文

推荐专利

申请号：CN202411878627

申请日期：2024-12-19

公开号：CN119758906A

公开日期：2025-04-04

类型：发明专利

摘要

本发明公开了一种基于深度强化学习的带运输时间的柔性作业车间调度方法，所述方法采用带迁移网络的PPO算法进行求解，其方法的包括：首先，构建带运输时间的柔性作业车间调度问题算例用于进行模型训练；其次，构建合适的马尔可夫决策模型，将目标问题转化为马尔可夫决策过程；再次，构建合适的PPO算法智能体A1，使用训练数据对智能体A1进行充分训练，通过梯度下降对策略网络和价值网络进行优化；最后，构建新的PPO算法智能体A2，将A1的策略网络与价值网络迁移至A2中并进行微调，加入LSTM网络层及部分全连接层，使用A2对目标算例进行调度。本发明具有较好的调度性能，提出的深度强化学习模型能高效求解各规模的带运输时间的柔性作业车间调度问题实例。

技术关键词

柔性作业车间调度网络策略计算机可读指令深度强化学习模型决策采样方法算法可读存储介质工件缩放参数数据线性定义规模

系统为您推荐了相关专利信息

神经内科护理安全隐患监测系统及方法

安全隐患监测系统神经内科护理安全隐患监测方法医疗知识图谱节点

一种智慧电厂中APT检测方法、设备及存储介质

识别恶意软件消除技术日志语义冗余

一种车辆的近撞检测方法、装置、终端设备和存储介质

车辆图像参数训练样本集训练数据量

一种用于台区柔性直流互联系统的能量管控方法

柔性直流互联能量管控方法有功功率可调设备变量

一种智慧园区多维数据融合与智能分析系统

智能分析系统生成对抗网络模型时间序列特征格式动态时间规整算法

基于深度强化学习带运输时间的柔性作业车间调度方法及系统

站点导航

APP 下载