摘要
本发明公开了面向多机器人动态调度系统的量化感知分布式深度强化学习方法,涉及机器人集群任务调度优化领域;S1对待规划的集装箱装卸任务做预处理,预处理包括调度时间离散化、需求优先级量化与需求约束信息记录;S2基于S1中的装卸任务和集装箱类型‑机器人机械特性的兼容信息,具体过程包括决策变量、约束条件的定义以及目标函数的建立;S3应用融合量化感知训练的分布式深度强化学习算法对模型求解得到最优实时资源调度方案,S4输出并部署可执行的最优实时资源调度方案。实现了对多港口多机器人系统场景下的任务调度优化,在面对高维全局状态空间时可快速得到一个收益较高的调度部署方案,且优化机器人集群在货物装卸操作中的协同调度效率。
技术关键词
分布式深度强化学习
面向多机器人
动态调度系统
机器人机械结构
深度强化学习算法
决策
机器人运动能耗
任务调度
规划
分布式控制方式
量化误差
任务分配信息
多机器人系统
集装箱单元
资源
协作模型
分布式环境
深度Q网络