摘要
本发明提供了一种基于双重DQN网络的热轧生产调度方法、系统及电子设备,涉及生产调度技术领域。该方法包括如下步骤:收集历史热轧生产数据集并对其预处理;将预处理后的历史热轧生产数据集按照预定比例划分训练集和测试集;构建双重DQN网络,结合最小化轧制单元数量、最小化规格跳变成本和最小化未排入板坯惩罚三个目标,设计综合奖励函数;利用训练集和测试集分别训练和验证双重DQN网络,得到调度优化模型;将当前生产批次下的板坯规格信息、生产需求信息、约束条件信息输入至调度优化模型,由调度优化模型输出最优动作策略;求解最优动作策略得到最优生产调度方案。本方法可以在小样本数据情况下快速获得高质量的热轧生产调度方案。
技术关键词
调度优化模型
轧制单元
板坯
动作策略
热轧
网络
调度优化系统
计算机程序指令
数据处理模块
样本
输出模块
电子设备
表达式
参数
因子
处理器
误差
动态
系统为您推荐了相关专利信息
人工智能算法
学习系统
规划最优路径
收集训练数据
动作策略
三维成像数据
NURBS曲面建模
板坯
智能控制方法
转盘设备
调度优化模型
节点
算力调度方法
资源
计算机程序产品
贝叶斯网络模型
线性回归模型
线性规划模型
大数据
长短期记忆网络