摘要
本发明公开了一种基于深度强化学习的高度自适应无人机集群协同目标搜索方法。该方法针对复杂环境下的大规模运动目标搜索问题,通过重访时间补偿机制解决因目标运动导致的环境认知信息图不可靠问题。方法采用分布式部分可观察马尔可夫决策过程对无人机群的分层协同搜索进行建模,并基于价值分解网络的深度强化学习算法学习联合策略。这使得无人机群能够充分利用不同高度下的传感器性能特性,在减少与邻近无人机和障碍物碰撞风险的同时,提高协同搜索动态目标的能力。仿真结果表明,该算法相比基线算法和现有传统算法具有优越性和可扩展性。
技术关键词
无人机集群协同
深度强化学习算法
搜索方法
无人机群协同
网格
全局状态信息
贝叶斯准则
设计无人机
引导无人机
无人机高度
分布式协同
障碍物
深度神经网络
决策
邻居
虚警概率
增量更新
系统为您推荐了相关专利信息
离散相模型
壁面温度
结构化网格
热传导方程
耦合算法
机器学习分类器
电介质材料
筛选方法
超参数
训练图像数据
小麦植株样品
智能鉴定方法
小麦小穗数
样品放置平台
坐标位置信息