一种基于TD3的无人机集群避障策略生成方法

AITNT
正文
推荐专利
一种基于TD3的无人机集群避障策略生成方法
申请号:CN202411571175
申请日期:2024-11-06
公开号:CN119440056A
公开日期:2025-02-14
类型:发明专利
摘要
本发明提出了一种基于双延迟深度确定性策略梯度(TD3)的无人机集群避障策略生成方法。该方法通过结合任务需求、环境条件和无人机性能参数,构建马尔可夫决策模型,包括状态空间、动作空间和奖励函数,并通过TD3算法对模型进行训练。首先,确定无人机集群的目标运动方向和密度,并设定最小安全间距和障碍距离,以确保飞行安全;然后,定义奖励函数,引导无人机在复杂环境中实现有效的避障和队形保持。与传统的规则驱动和经典算法(如几何路径规划、人工势场法)相比,基于TD3的方案具备更强的自适应能力和灵活性,能够在动态环境中快速调整策略,避免陷入局部最优。此外,TD3算法通过延迟策略更新和经验回放,提升了策略的稳定性和收敛性,使无人机集群在高密度场景下保持实时避障和队形稳定。实验结果显示,该方法在模拟环境中能够有效避开障碍物,维持预设队形,并减少能量消耗,证明了其在无人机集群协同任务中的应用潜力。本发明适用于军事、物流配送、环境监测等领域的多无人机集群任务,可显著提升任务执行效率和安全性。
技术关键词
策略生成方法 深度确定性策略梯度 网络 生成无人机 在线 无人机集群协同 生成动作 高密度场景 决策 加速度 引导无人机 人工势场法 定义 控制无人机 经典算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号