摘要
本发明涉及一种基于Transformer的跨模态特征融合与精炼的目标跟踪方法,包括对给定的RGB与红外视频序列获取模板图像对和搜索图像对;构建包含非对称周期性插入令牌自适应融合与精炼模块的双路目标跟踪网络;将模板图像对和搜索图像对分别输入双路目标跟踪网络,通过令牌自适应融合与精炼模块进行跨模态特征融合与精炼,并将融合后的特征矩阵送入预测头,最终输出跟踪目标的位置信息。本发明解决现有RGBT跟踪器中跨模态特征融合不充分、计算冗余以及未能对模板和搜索区域特征进行差异化处理的问题,通过引入一个非对称应用的令牌自适应融合与精炼模块,在有效融合多模态信息的同时,提升了计算效率和跟踪的鲁棒性。
技术关键词
模态特征
跟踪方法
输出特征
加权特征
令牌
图像
模板
RGB特征
模块
融合多模态信息
适配器
跨模态
网络
多头注意力机制
编码器
描述符
分支
代表
坐标系
系统为您推荐了相关专利信息
分支卷积神经网络
分类系统
理化特征
分类器
瓶颈结构
急性肾损伤
风险预测模型
主动脉弓
风险预测方法
风险预测装置
车轮零部件
多尺度特征
网络模块
输出特征
卷积特征提取
面部表情识别模型
面部图像数据
面部关键点检测
语义特征
面部表情特征
岩体稳定性检测
信号
特征提取单元
历史监测数据
声发射