摘要
一种基于多智能体强化学习和上下文感知的多自动导引车路径规划方法,属于机器学习与智能物流的交叉领域。本发提出的上下文感知信息充分利用AGV在训练过程中对环境的理解,通过自身的长时记忆针对当前AGV的观测信息产生用于辅助其它智能体决策的上下文感知信息。在进行多智能体通信强化学习时,利用AGV的局部特征信息来产生多样化的通信信息,之后结合AGV自身的局部特征信息,得到最终的决策动作概率分布结果。基于集中式训练、分布式执行的训练范式,多AGV系统能够很好的学习到一个高效、直接的路径规划解决方案,有效的提高了AGV在地图上的路径规划效率及准确率,同时也降低了AGV之间的碰撞冲突。
技术关键词
上下文感知信息
多智能体强化学习
混合网络
局部特征信息
路径规划方法
自动导引车
全局状态信息
栅格地图
环境地图建模
障碍物
多AGV系统
决策
记忆
重构
路径规划效率
多头注意力机制
系统为您推荐了相关专利信息
混合神经网络模型
惯性平台
扰动估计方法
GRU模型
RNN模型
网格
路径规划方法
Petri网建模
二维平面坐标系
动态
潜航器
路径规划方法
强化学习算法
格子Boltzmann方法
流场环境