摘要
本发明涉及一种Transformer架构的视频卫星多目标跟踪方法,利用CNN骨干网络提取输入视频相邻帧的特征信息;利用Transformer编码器的自注意力模块对所提取的特征信息进行编码;利用目标检测解码器,以学习的目标特征作为查询,以编码器提取的特征信息作为键,对当前帧的目标进行检测,得到目标检测框集合值(Value);利用目标跟踪解码器,基于滤波算法对前一帧获取的目标位置信息进行预测,作为查询,以编码器提取的特征信息作为键,对前一帧目标在当前帧的位置进行预测,得到目标跟踪框集合;对目标检测框集合和目标跟踪框集合进行IoU匹配,根据跟踪结果对轨迹采用显性/隐形表达显示。本发明在有目标丢失等情况下更容易准确匹配到目标,提升对卫星视频的跟踪效果。
技术关键词
跟踪方法
检测解码器
视频
编码器
轨迹
注意力
网络
滤波算法
坐标
模块
视野
定义
运动
系统为您推荐了相关专利信息
虚拟现实装置
虚拟现实资源
硬件检测
画面显示内容
VR装置
医疗数据管理系统
数据采集模块
存储模块
数据交互模块
患者
缺陷检测单元
注意力机制
输电线路缺陷
检测头
光伏电池缺陷