摘要
本发明公开了一种基于运动矢量引导局部注意力的视频目标检测方法,在单帧检测模型基础上,利用视频帧间的时间相关性,通过相邻帧传播特征以增强当前帧特征。上述方法包括:使用递归融合的视频目标检测框架;通过运动矢量引导局部注意力对齐的方式进行特征对齐;采用Faster R‑CNN作为单帧检测模型。将Faster R‑CNN分为特征提取网络和目标检测任务网络,每个视频帧都需送入特征提取网络以提取视频帧特征,在时间维度上利用运动矢量引导局部注意力方式传播一个含有历史帧中语义信息的记忆特征,通过特征融合增强当前帧特征,每个视频帧的增强特征图既用于当前帧的检测,也为下一帧检测提供足够的语义信息和时间信息,实现了精度与速度的良好平衡。
技术关键词
特征提取网络
预测运动矢量
记忆特征
运动矢量预测
注意力
视频帧特征
通道
图像
矢量图
语义
感兴趣
序列
分辨率
尺寸
场景
框架
精度
系统为您推荐了相关专利信息
数学主观题解答
训练语言模型
知识点
图谱
语义关联度
类别预测方法
融合特征
融合分类器
大数据
注意力机制
像素点
水体
密度峰值聚类算法
专题地图
地理坐标信息
个性化习题推荐方法
学生
策略
概念
强化学习方法