摘要
本申请涉及一种基于强化学习的多无人机三维协同搜索动目标方法和装置,该方法根据高空无人机探测范围广和低空无人机检测质量高的特点,构建多无人机高低空协同搜索架构;在该架构下以最大限度减少搜索区域的不确定性和最大化捕获动态目标数量为优化目标,建立多无人机协同搜索三维场景中动态目标的路径规划问题;采用改进的MAPPO算法求解该路径规划问题;在算法中引入基于视野编码的状态表示机制,解决了神经网络输入维度动态变化的问题;引入基于规则的目标捕获机制和基于动作掩码的碰撞避免机制,提高了改进的MAPPO算法的收敛速度。本方法在降低区域不确定性和增加捕获的动态目标数量方面具有显著优势,提高了目标捕获能力和安全性。
技术关键词
多无人机协同
高空无人机
栅格
捕获机制
低空无人机
策略
规划
视野
网络
动态
掩码规则
掩码技术
场景
Softmax函数
掩码矩阵
编码
算法
系统为您推荐了相关专利信息
动态贝叶斯网络模型
栅格
烟草黑胫病
长短期记忆网络
智能预警方法
计算机视觉
多目摄像头
避障路径
无人机姿态
分层控制策略