摘要
本发明涉及一种基于深度强化学习的配送机器人订单分配方法,采用多任务‑近端策略优化模型(MT‑PPO)动态优化任务调度策略,使配送任务的平均完成时间降低,超时率减少,显著提升物流配送效率。通过设定的马尔科夫决策模型构建模型架构的预测主任务和辅助任务的智能任务均衡策略,使机器人任务负载更加均衡,有效避免某些机器人任务过重,而其他机器人处于空闲状态,提升机器人资源利用率。
技术关键词
订单分配方法
配送机器人
深度强化学习
策略优化模型
多任务
数据
注意力
代表
决策
医院物流系统
物流配送效率
任务调度策略
后机器人
均衡策略
模块
参数
解码器