摘要
本申请公开了一种面向数据收集的多无人机动态路径规划方法、装置、设备及介质,其中,该方法包括两阶段,其中,第一阶段离线路径预规划阶段采用多智能体深度确定性策略梯度算法,为每一架无人机分配自己的Actor‑Critic网络进行训练学习,同时,单独设计总体的Critic网络,用于各无人机观测全局信息,实现多无人机之间的合作学习;第二阶段在线路径重规划阶段采用遗传算法,在各时隙开始时对包含静态兴趣点和动态兴趣点的地图进行搜索迭代,找出当下时隙最优路径,并对无人机进行路径重规划;由此,通过两阶段结合,使得无人机集群可以在同时考虑动态静态两种兴趣点情况下,最大化其数据收集获得的总奖励。
技术关键词
兴趣点
强化学习网络
执行飞行动作
遗传算法
深度确定性策略梯度
动态路径规划
离线
两阶段
无人机集群
数据
多无人机
在线
处理器
可读存储介质
系统为您推荐了相关专利信息
功率点跟踪方法
遗传算法
光伏组件
工作点
模糊规则
阻力矩
卡尔曼滤波融合
校准
新能源拖拉机
模糊推理模型
力学性能参数
复合材料储氢瓶
结构优化方法
渐进损伤模型
模拟退火算法