摘要
本发明提出了基于多智能体强化学习的多资源柔性作业车间调度方法。本发明实现方法为:针对柔性作业车间中工件、AGV和机器的联合调度问题,以完工时间最小化为优化目标,建立多资源柔性作业车间调度模型;创建工件分配智能体解决工件分配问题;创建AGV调度智能体解决AGV选择问题;创建工序选择智能体解决机器工序选择问题;定义各类智能体的状态空间、动作空间以及奖励函数,使用DDQN方法分别对各智能体进行训练;在不同车间规模下验证所提方法的优越性。本发明旨在通过多智能体强化学习,实现多资源柔性作业车间调度策略的优化。
技术关键词
多智能体强化学习
柔性作业车间调度
工件
资源
启发式算法
网络
规模
调度算法
决策
机器设备
范畴
参数
策略
因子
定义
车辆
系统为您推荐了相关专利信息
动态分配策略
管控系统
加密策略
数据处理模块
大数据平台
轴承套圈
脉冲涡流检测装置
硬度检测方法
傅立叶
数据
水资源优化配置
非合作博弈
高原
遗传算法求解
博弈决策方法
工程量清单
自动编制方法
资源分配
天气风险评估
节点