摘要
本发明公开了一种三维环境下基于注意力增强的多无人机协同航迹规划方法。本发明属于无人机控制领域,主要解决了多无人机在复杂且未知的三维环境中实现实时避障并协同航迹规划的问题。所提方法通过多无人机导航问题建模为一个部分可观测马尔可夫决策过程问题,利用深度强化学习对问题进行求解。该方法不仅将长短期记忆网络网络集成到多智能体深度强化学习框架中以捕捉潜在的状态信息,还引入了注意力机制来提取障碍物相关信息。并且,通过设计多种面向目标的奖励函数有效地解决了奖励稀疏的问题。本方法确保了多无人机在复杂三维环境中实现避开障碍物的同时能够协同完成航迹规划,仿真实验证明了该方法的有效性和鲁棒性。
技术关键词
障碍物
航迹规划
深度强化学习
控制无人机
三维环境感知
网络
感知周围环境
激光雷达探测仪
无人机系统设计
注意力机制
确定性策略梯度
动作策略
邻居
多无人机协同
集群无人机
距离信息