摘要
本发明涉及一种基于时序建模和提示微调的多模态目标跟踪方法及系统,该方法包括:构建多模态目标跟踪网络模型,包括可见光分支、红外光分支及多模态时间提示器、跨模态帧内双适配器和边界框预测头,每个分支包括时空Transformer编码器和时间提示引导器;时空Transformer编码器用于特征提取,时间提示引导器用于向后续帧传递时间信息,多模态时间提示器用于增强主导模态的时间提示,跨模态帧内双适配器用于融合双分支的模态空间特征,边界框预测头用于预测跟踪结果;对模型进行训练,在训练过程中仅更新时间提示引导器、多模态时间提示器和跨模态帧内双适配器的参数;将训练好的模型应用于多模态目标跟踪。该方法及系统能够提高目标跟踪的准确性、鲁棒性和效率。
技术关键词
时间提示器
红外光
多模态
引导器
适配器
跟踪方法
序列
多层感知机
编码器
图像
多头注意力机制
分支
跨模态
可见光视频
模板
时序
计算机程序指令
网络
系统为您推荐了相关专利信息
洗涤设备
负载均衡优化
智能控制方法
多模态
通信特征
神经网络模型
数据输出模块
融合特征
多头注意力机制
池化特征
脉冲神经膜系统
图像分割模型
数值
保留图像边缘
多阈值