摘要
本发明属于无人机路径规划技术领域,尤其为一种融合人工势场的深度强化学习多无人机路径规划方法,包括以下步骤,S1,构建包含静态与动态障碍物的三维仿真环境,构建UAV在未知环境进行路径规划的系统模型,基于所构建的系统模型构建UAV路径规划的优化问题,以最小化任务完成时间并避免障碍物为目标。本发明通过将人工势场合力嵌入TD3算法的状态空间,并设计多维度奖励函数,解决了传统深度强化学习训练效率低、避障能力不足的问题。实验表明,该方法在动态障碍物场景中任务成功率提升10%‑30%,碰撞率降低20%‑50%,可实时生成光滑无碰撞轨迹,适用于多无人机集群的协同导航与应急救援任务。
技术关键词
深度强化学习
动态障碍物
人工势场
规划
仿真环境
场景
决策
算法
因子
生成无碰撞
重力场
策略
采集无人机
静态障碍物
无人机集群
控制无人机