摘要
本发明公开了一种基于分层强化学习的多无人机未知区域目标搜索方法,包括:将包括多个目标和多个障碍物的搜索区域划分为若干个搜索网格,并为多个无人机各自分配一个搜索网格,利用无人机对搜索区域进行搜索,获得搜索数据并传至地面站;在地面站,基于集中式训练、分布式执行和分层强化学习框架,训练一个区域覆盖协调策略网络作为上层决策网络;训练一个目标追踪识别策略网络作为下层决策网络;将区域覆盖协调策略网络和目标追踪识别策略网络集成到每个无人机上,以指导无人机执行目标搜索任务。该方法在多无人机协同目标搜索任务中实现了高效搜索区域覆盖、持续跟踪以及动态避障能力,并且通过集中式训练、分布式执行提高了算法的鲁棒性。
技术关键词
分层强化学习
识别策略
搜索方法
网络
网格
地面站
障碍物
决策
识别模块
雷达模块
SAC算法
数据
无人机协同
通信接口
抽象方法
动态避障
可读存储介质
系统为您推荐了相关专利信息
路侧单元
网络节点
升级控制方法
车辆状态信息
升级控制装置
生物滤池反应器
综合评价方法
厌氧氨氧化颗粒
污泥
厌氧氨氧化方法
图像编辑方法
图像残差
图像处理模型
人脸关键点
图像提取模块
瓦楞纸箱
神经网络模型
数据
超声波发生器
热处理
检测网络模型
车削中心
视觉识别方法
视觉识别系统
图像采集模块