摘要
一种基于自注意力和强化学习的多无人机目标搜索方法,是将无人机的目标搜索任务转化为多智能体协作问题,把每架无人机作为一个独立的智能体,采用策略网络SA‑MADDPG进行目标搜索;同时,采用维诺图合理划分搜索区域,并用目标概率图TPM帮助评估目标的可能分布,使无人机优先搜索高目标概率区域;最后,在搜索任务执行过程中,根据实时反馈调整搜索策略,以适应目标的动态变化。
技术关键词
无人机
搜索方法
策略
注意力机制
贝叶斯推理方法
机载传感器
贝叶斯方法
网络结构
特征提取网络
网格地图
梯度下降法
障碍物
动态更新
信息更新
三通道