一种基于TD3的无人机集群避障策略生成方法

正文

推荐专利

申请号：CN202411571175

申请日期：2024-11-06

公开号：CN119440056A

公开日期：2025-02-14

类型：发明专利

摘要

本发明提出了一种基于双延迟深度确定性策略梯度(TD3)的无人机集群避障策略生成方法。该方法通过结合任务需求、环境条件和无人机性能参数，构建马尔可夫决策模型，包括状态空间、动作空间和奖励函数，并通过TD3算法对模型进行训练。首先，确定无人机集群的目标运动方向和密度，并设定最小安全间距和障碍距离，以确保飞行安全；然后，定义奖励函数，引导无人机在复杂环境中实现有效的避障和队形保持。与传统的规则驱动和经典算法(如几何路径规划、人工势场法)相比，基于TD3的方案具备更强的自适应能力和灵活性，能够在动态环境中快速调整策略，避免陷入局部最优。此外，TD3算法通过延迟策略更新和经验回放，提升了策略的稳定性和收敛性，使无人机集群在高密度场景下保持实时避障和队形稳定。实验结果显示，该方法在模拟环境中能够有效避开障碍物，维持预设队形，并减少能量消耗，证明了其在无人机集群协同任务中的应用潜力。本发明适用于军事、物流配送、环境监测等领域的多无人机集群任务，可显著提升任务执行效率和安全性。

技术关键词

策略生成方法深度确定性策略梯度网络生成无人机在线无人机集群协同生成动作高密度场景决策加速度引导无人机人工势场法定义控制无人机经典算法

一种基于TD3的无人机集群避障策略生成方法

站点导航

APP 下载