摘要
本发明公开了一种基于领导者跟随者模型的多机协同编队航迹规划方法,涉及环境感知与无人机集群协同技术领域。首先设计了一种基于领导者‑跟随者模型的多智能体双重延迟深度确定性策略梯度(Leader‑Follower Multi‑Agent Twin Delayed Deep Deterministic Policy Gradient,LFMATD3),通过引入人工势场模型与奖励函数,将优化问题模型转化为马尔可夫决策过程模型;其次,针对每架无人机分别构建独立智能体,基于深度强化学习的算法框架,结合奖励函数优化无人机的行为策略,进行航迹规划并实现动态编队控制。本发明所提方法可有效提高无人机在复杂环境下的编队稳定性和协同性。
技术关键词
航迹规划方法
深度确定性策略梯度
无人机航迹规划
协同通信系统
障碍物
人工势场
支持动态交互
无人机集群协同
算法框架
因子
更新网络参数
决策
偏差
深度强化学习
独立智能
多无人机
系统为您推荐了相关专利信息
路径规划系统
收获机
主控模块
人机交互模块
避障模块
管道机器人
远程操控方法
距离信息
数字孪生
驱动轮
集群算法
评估系统
任务分配算法
编队控制算法
规划
音频特征
策略
强化学习模型
驱动执行装置
动态障碍物
控制工业机器人
障碍物
监测作业
道路风险指数
决策算法