摘要
本发明涉及移动机器人智能控制技术领域,尤其是指一种多移动机器人的全局路径协调方法、系统及存储介质,包括:构建仿真环境和移动机器人的运动学模型,设计多移动机器人的路径规划模型;分别基于双层神经网络中避障规划层和相对位置协调层设计奖励函数,用于训练多移动机器人的路径规划模型;基于完成训练的多移动机器人的路径规划模型进行多移动机器人的全局路径规划。本发明解决了深度强化学习在多机器人导航中维度爆炸和难以收敛的问题,能够有效适应复杂和不规则环境下多移动机器人自主导航的需求,提高了多移动机器人全局路径规划的效率和准确性。
技术关键词
强化学习网络
全局路径规划
特征值
仿真环境
移动机器人执行
参数更新方法
周围环境信息
深度强化学习
算法
策略
可读存储介质
协调系统
计算机