基于跨模态交互增强与知识蒸馏的快速RGBT目标跟踪方法

AITNT
正文
推荐专利
基于跨模态交互增强与知识蒸馏的快速RGBT目标跟踪方法
申请号:CN202510894590
申请日期:2025-06-30
公开号:CN120807580A
公开日期:2025-10-17
类型:发明专利
摘要
本申请的实施例涉及计算机视觉技术领域,特别涉及一种基于跨模态交互增强与知识蒸馏的快速RGBT目标跟踪方法,该方法包括:基于可见光模态、热红外模态的模板图像、搜索区域和对应的真实标签构建训练样本集;构建由可见光特征提取网络、热红外特征提取网络、跨模态交互增强网络和多模态跟踪头组成的RGBT目标跟踪模型;选定教师模型,并将RGBT目标跟踪模型作为学生模型;将训练样本集中的样本对应输入至学生模型、可见光教师模型和热红外教师模型,进行模态间蒸馏和模态内蒸馏,再结合真实标签和多模态跟踪头的输出,构建总体损失函数并进行训练至收敛为止,得到训练完成的RGBT目标跟踪模型;对训练完成的RGBT目标跟踪模型进行部署,实现实时RGBT目标跟踪。
技术关键词
可见光 跨模态 特征提取网络 教师 学生 蒸馏 跟踪方法 分支 令牌 协方差矩阵 训练样本集 通道 模块 融合特征 计算机视觉技术 标签 像素 融合语义 处理器
系统为您推荐了相关专利信息
1
一种塑料包装桶自动封口检测方法及系统
塑料包装桶 封口检测方法 可见光图像 褶皱 坐标系
2
一种基于DWPose算法的人体穴位精准识别方法
精准识别方法 穴位 人体 蒸馏 训练集
3
一种基于多源数据融合的高压隔离开关状态识别方法及系统
隔离开关状态 数据分布 融合特征 高压隔离开关 压油装置
4
一种自巡检红外无人机巡检方法及装置
无人机巡检方法 检测塔机 巡检路径 像素点 多源融合
5
教具机器人智能对话系统及方法
教具机器人 编码向量 智能对话系统 线索 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号