摘要
本发明提供基于深度强化学习的智能仓储机器人群体协同调度方法,涉及智能仓储技术领域,包括通过层次化注意力机制构建群体感知模块,生成动态协同感知矩阵;建立深度强化学习模型进行策略学习;设计多层级奖励函数并通过自适应权重调节机制优化训练过程。本发明提高了仓储机器人群体调度的协同效率,降低了任务冲突率,增强了系统对复杂动态环境的适应性。
技术关键词
深度强化学习模型
复杂度
智能仓储机器人
机器人状态信息
矩阵
协同调度方法
层级
动态
注意力机制
时序
因子
网络
计算机程序指令
协作模式
梯度投影方法
指标
策略