摘要
本发明公开了一种面向通信拒止环境下的多无人机协同目标跟踪方法,包括以下步骤:设定多智能体学习系统的相关要素,包括智能体状态类型及维度、动作类型及维度、奖励函数及算法相关超参数;构建多智能体策略网络、评价网络以及对比学习框架;建立多无人机目标跟踪的仿真环境,通过无人机智能体与环境的交互,获取智能体观测信息,部分环境信息及奖励信息,存放于经验回放池;通过采样经验池中的数据,同时对强化学习目标以及对比学习目标进行优化,其中对比学习框架输出的辅助信息能够帮助智能体获得额外的全局信息,训练至收敛后,利用得到的策略网络为无人机生成所要执行的动作。本发明能够实现通信拒止环境下的多无人机协同目标跟踪任务。
技术关键词
跟踪方法
网络
策略
无人机飞行高度
仿真环境
注意力
深度强化学习算法
学习系统
连续动作空间
多无人机协同
深度图像信息
超参数
框架
生成无人机
静态障碍物
系统为您推荐了相关专利信息
需求响应策略
中央空调
冷冻水回水温度
制冷系统
功率
自动化产品检测系统
图像处理单元
多光谱成像设备
深度神经网络模型
分析单元
智能巡检设备
评估桥梁
集群
评估系统
智能视觉识别
原位修复方法
深度特征融合网络
RANSAC算法
CCD相机
激光扫描仪