一种适用于作业车间调度的强化学习智能体交互策略网络训练方法、程序产品及系统

正文

推荐专利

申请号：CN202410861456

申请日期：2024-06-28

公开号：CN118657337A

公开日期：2024-09-17

类型：发明专利

摘要

本发明属于车间调度领域，公开了一种适用于作业车间调度的强化学习智能体交互策略网络训练方法、程序产品及系统。该方法应用深度强化学习方法解决车间调度问题，针对现有强化学习环境设计研究十分不充分的现状，通过提供连续和离散两种动作模式，适配于几乎所有经典强化学习算法，在所测试的多种算法上均能取得计算时间短，质量高的调度方案，进而提高生产稳定性以及产品质量，降低产品制造周期等，以此带来可观的经济效益。使用上述方法构建强化学习环境和交互策略，可以获得高可复用性、高效率、高质量的作业车间调度方案生成模型。

技术关键词

作业车间调度智能体交互网络训练方法连续动作空间工件决策强化学习环境强化学习算法深度强化学习方法强化学习策略序列程序高效率周期模式数据

系统为您推荐了相关专利信息

一种智能化激光-干冰复合清洗方法及装置

复合清洗方法清洗工件表面激光清洗系统干冰清洗系统视觉识别系统

一种考虑恶化效应的动态混合流水车间调度方法

工件 DQN算法列表混合流水车间调度效应

一种机器人机械手臂防松脱抓取控制方法及系统

机器人机械手臂抓取控制方法防松脱工件光谱反射率信息

基于多智能体交互的槽位信息补充方法、装置及设备

槽位识别意图识别智能体交互输入模块列表

一种铁塔构件钢板拼焊机器人的工件同一性控制方法

铁塔构件工件装夹定位多功能组合夹具数据绑定机制电压电流监控

一种适用于作业车间调度的强化学习智能体交互策略网络训练方法、程序产品及系统

站点导航

APP 下载