摘要
本发明提出一种基于耦合知识蒸馏的多模态目标跟踪方法和系统:包括:耦合知识蒸馏:在两个学生分支的风格特征之间进行风格蒸馏,在具有相同模态输入的教师和学生分支之间执行内容蒸馏,采用实例归一化操作对教师和学生分支的原始特征进行归一化,从而获得与风格特征正交的内容特征,计算两组教师和学生分支的内容特征之间的相似性以进行内容蒸馏;掩码建模:将学生分支的输入图像随机掩去25%的像素,相应教师分支的输入保持不变,让学生分支自行从教师分支的内容特征中学习恢复掩去部分的特征;多模态候选token消除:在每一层中通过组合两种模态的注意力权重协同决策出候选消除的令牌。本发明通过风格蒸馏打破模态差异,同时利用内容蒸馏从教师网络中保持特征内容表示的稳定,以实现高性能的多模态跟踪。
技术关键词
分支
教师
学生
蒸馏
补丁
令牌
跟踪方法
中间层
序列
多模态
风格
模板
跟踪系统
注意力
编码
网络
策略
代表
通道
模块
系统为您推荐了相关专利信息
负荷特征
电子元件
集成电路芯片
分流系统
冷空气
异常检测方法
神经网络模型
异常检测装置
度量
偏差
诊断维修方法
柔性电路板
信息熵
分支
数据采集模块
细胞治疗产品
自动检测系统
磁珠
显微镜
数据处理算法