摘要
本发明属于车间调度领域,公开了一种适用于作业车间调度的强化学习智能体交互策略网络训练方法、程序产品及系统。该方法应用深度强化学习方法解决车间调度问题,针对现有强化学习环境设计研究十分不充分的现状,通过提供连续和离散两种动作模式,适配于几乎所有经典强化学习算法,在所测试的多种算法上均能取得计算时间短,质量高的调度方案,进而提高生产稳定性以及产品质量,降低产品制造周期等,以此带来可观的经济效益。使用上述方法构建强化学习环境和交互策略,可以获得高可复用性、高效率、高质量的作业车间调度方案生成模型。
技术关键词
作业车间调度
智能体交互
网络训练方法
连续动作空间
工件
决策
强化学习环境
强化学习算法
深度强化学习方法
强化学习策略
序列
程序
高效率
周期
模式
数据
系统为您推荐了相关专利信息
复合清洗方法
清洗工件表面
激光清洗系统
干冰清洗系统
视觉识别系统
机器人机械手臂
抓取控制方法
防松脱
工件
光谱反射率信息
铁塔构件
工件装夹定位
多功能组合夹具
数据绑定机制
电压电流监控