自适应关键帧挖掘和时空图学习引导的多模态多目标跟踪方法

AITNT
正文
推荐专利
自适应关键帧挖掘和时空图学习引导的多模态多目标跟踪方法
申请号:CN202510241766
申请日期:2025-03-03
公开号:CN120070506A
公开日期:2025-05-30
类型:发明专利
摘要
本发明公开一种自适应关键帧挖掘和时空图学习引导的多模态多目标跟踪方法,获取视频段的所有帧图像,将同一帧图像对应的可见光图像和热红外图像输入特征融合模块,生成嵌入;利用交叉注意力进行多模态间信息的融合,得到多模态融合特征;通过关键帧提取模块对视频进行自适应视频分段;关键帧提取模块基于强化学习方法,在学习过程中不断迭代最优的分段策略和最优奖励得分;将自适应分好的视频序列重复输入帧内特征融合模块模块和SUSHI块得到最终的跟踪结果。本发明利用热红外图弥补单模态信息的不足,利用强化学习自适应进行视频分段解决IDS问题;利用SUSHI模块挖掘帧间目标的时间关系,利用IFF模块挖掘帧内目标间的空间关系,进一步解决遮挡、相似外观问题,使得跟踪效果得到提升。
技术关键词
关键帧 融合特征 跟踪方法 视频 可见光图像 多模态 模块 分段 强化学习方法 序列 策略 注意力 关系 机制 节点 表达式 因子 代表 网络
系统为您推荐了相关专利信息
1
一种短剧聚合与分享平台
分享平台 内容推荐算法 内容分类 模块 优化用户体验
2
视频数据的处理方法和装置、存储介质及电子设备
双流神经网络 特征提取模型 相邻两帧图像 静态特征 特征点
3
模型训练方法、视频检测方法、装置、电子设备、存储介质及计算机程序产品
视频段 样本 对象检测模型 模型训练方法 视频帧
4
一种遥感图像分割方法、系统、设备及存储介质
遥感图像分割方法 加法器 归一化模块 残差模块 图像分割模型
5
基于多通道图像特征安全标记的视频内容保护方法和装置
视频内容保护方法 视频帧 感知哈希算法 图像 标记
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号