摘要
本发明公开一种自适应关键帧挖掘和时空图学习引导的多模态多目标跟踪方法,获取视频段的所有帧图像,将同一帧图像对应的可见光图像和热红外图像输入特征融合模块,生成嵌入;利用交叉注意力进行多模态间信息的融合,得到多模态融合特征;通过关键帧提取模块对视频进行自适应视频分段;关键帧提取模块基于强化学习方法,在学习过程中不断迭代最优的分段策略和最优奖励得分;将自适应分好的视频序列重复输入帧内特征融合模块模块和SUSHI块得到最终的跟踪结果。本发明利用热红外图弥补单模态信息的不足,利用强化学习自适应进行视频分段解决IDS问题;利用SUSHI模块挖掘帧间目标的时间关系,利用IFF模块挖掘帧内目标间的空间关系,进一步解决遮挡、相似外观问题,使得跟踪效果得到提升。
技术关键词
关键帧
融合特征
跟踪方法
视频
可见光图像
多模态
模块
分段
强化学习方法
序列
策略
注意力
关系
机制
节点
表达式
因子
代表
网络
系统为您推荐了相关专利信息
分享平台
内容推荐算法
内容分类
模块
优化用户体验
双流神经网络
特征提取模型
相邻两帧图像
静态特征
特征点
遥感图像分割方法
加法器
归一化模块
残差模块
图像分割模型
视频内容保护方法
视频帧
感知哈希算法
图像
标记