摘要
本发明公开了一种基于深度强化学习的无人机目标追踪方法及系统,该方法包括构建无人机目标追踪仿真模拟器;构建基于Resnet的特征提取网络;构建深度强化学习网络,包括:用于评估环境更新后的奖励值并反向更新策略网络的价值网络,用于根据特征提取网络提取的深度特征输出推荐的无人机行进方向及速度的策略网络;预训练深度强化学习网络并在无人机目标追踪仿真模拟器中进行强化学习训练;进行实际追踪。本发明将目标中心与视野中心距离作为衡量奖励的标准,降低计算复杂度并提高目标特征提取能力,使无人机在面临背景复杂、目标形变、目标丢失的追踪问题时表现出较强的适应能力和自主决策,能够应用于实机追踪。
技术关键词
深度强化学习
特征提取网络
倾斜摄影数据
追踪方法
构建无人机
模拟器
无人机航拍影像
追踪系统
速度
策略
模型训练模块
无人机图像采集
执行飞行动作
数据转换工具
视野
视频流
预测无人机
系统为您推荐了相关专利信息
多智能体强化学习
通信模块
决策
策略
状态监控单元
监督学习模型
识别方法
特征提取网络
计算机程序产品
分类器
车载网络切换方法
轨迹预测模型
基站
车辆
特征提取网络
卷积模块
图像分割方法
交叉注意力机制
执行矩阵乘法
变压器模块
图像分割方法
RGB特征
像素点
深度特征提取网络
线索