摘要
本发明公开了基于视觉提示学习的可见光与红外图像融合目标跟踪方法,涉及于扩展目标跟踪领域,包括输入视频图像数据、过块嵌入模块对图像进行转换、尺度感知注意力提取多尺度信息、双分支主干网络提取各模态特征、特定模态视觉提示学习与模态间视觉提示交互、交叉融合适应器和预测头步骤;本申请通过引入多尺度信息提取机制、增强视觉提示学习与交互能力、以及开发更为先进的多模态融合策略,实现更加可靠且高效的目标跟踪系统,通过这些改进,我们期望能够显著提高目标跟踪在复杂环境下的性能,满足实际应用的需求。
技术关键词
多尺度信息
前馈神经网络
红外图像特征
可见光图像
模态特征
跟踪方法
视觉
编码器
Softmax函数
生成特征
交叉注意力机制
模块
输出特征
双分支结构
多模态
融合策略
系统为您推荐了相关专利信息
纵断面线形
重构方法
转换器
数据
计算机程序指令
智能监控方法
训练智能
设备运行状态数据
梅尔频率倒谱系数
高清摄像头
设备状态监控方法
多模态数据融合
文本
交叉注意力机制
设备状态监控系统