摘要
本发明属于无人系统路径规划研究领域,为解决多个无人机对目标跟踪的轨迹规划问题。能够使得多无人机在复杂环境下规划出从起始点到目标点的轨迹,同时实现无人机动态目标跟踪及避障。本发明,基于深度强化学习方法的动态目标追踪路径规划方法,采用集中式训练分布执行CTDE的训练方法将确定性策略梯度算法DDPG算法用于确定多架无人机的控制输入,从而进行多无人机动态目标追踪路径规划与飞行控制,其中,每架无人机引入基本的演员评论家Actor‑Critic网络结构,分别学习属于无人机的确定性策略网络和动作评估函数。本发明主要应用于无人机设计制造场合。
技术关键词
追踪无人机
深度强化学习方法
确定性策略梯度
路径规划方法
多无人机
机载传感器
路径规划研究
算法
动态
分阶段
通信拓扑结构
探测无人机
引导无人机
障碍物
网络结构