摘要
本发明提供了一种分布式异构柔性作业车间调度方法、系统及装置,包括:以最小化最大完工时间为目标建立DHFJSP‑AGV的混合整数线性规划模型;将求解混合整数线性规划模型转化为马尔可夫决策过程,构建马尔科夫决策过程的状态空间、动作空间和奖励函数;通过深度强化学习构建深度Q网络模型,将状态空间的特征向量为输入,动作空间的复合调度规则为输出,以对深度Q网络模型进行训练,直至训练次数达到设定的迭代次数或奖励函数的奖励值收敛,得到训练后的深度Q网络模型;将训练后的深度Q网络模型根据车间生产情况对工厂、工件、机器和AGV进行协同调度。本发明利用深度强化学习求解DHFJSP‑AGV,能够生成合理的调度方案,减小最大完工时间,提高生产车间的效率。
技术关键词
深度Q网络
混合整数线性规划模型
深度强化学习
异构
工件
柔性作业车间调度
决策
参数
策略更新
模块
处理器
指令
因子
样本
系统为您推荐了相关专利信息
三维建模方法
接触网检修
异构
三维点云模型
深度相机
工位转换装置
开孔设备
电主轴
双工位夹具
安装支架
网络漏洞检测方法
皮尔逊相关系数
特征选择算法
实时数据处理
预警机制
集成管理平台
历史故障数据
OLT设备
光猫
探针系统
人工神经网络
配置网络
变压器
深度强化学习
FFT模块