一种基于掩码对比学习预训练的视觉目标跟踪方法

正文

推荐专利

申请号：CN202410767226

申请日期：2024-06-14

公开号：CN118674749A

公开日期：2024-09-20

类型：发明专利

摘要

本发明公开了一种基于掩码对比学习预训练的视觉目标跟踪方法，属于计算机视觉与目标跟踪领域，为了解决提高跟踪任务预训练适应性的问题，技术要点是获得模板目标和当前的查询视频帧的输入图像并划分为固定尺寸的图块，图块展平为图块向量并输入tokens传递给ViT模型；ViT模型根据当前图块向量与所有其他图块向量的上下文信息，捕获查询目标和模板目标的全局关系，通过嵌入层将每个图块向量投影到更高维度的特征空间；ViT模型的前馈神经网络对每个图块向量的特征进行局部转换和表示并对全局特征与局部特征融合并输入目标检测器中；目标检测器对融合特征进行回归及预测，效果是能够利用跟踪任务本身的视频数据，进行高效的预训练。

技术关键词

跟踪方法前馈神经网络融合特征样本视角检测器模板注意力编码器图像视频帧计算机视觉分支优化器周期索引数据代表

系统为您推荐了相关专利信息

一种基于自适应特征扰动的半监督遥感图像变化检测方法

标签训练集学生样本扰动方法教师

一种兼顾血糖浓度与血糖趋势的持续血糖预测方法、系统

血糖预测模型血糖预测方法滑动时间窗口预测血糖浓度批量

一种游戏账号智能估值系统

智能估值系统模型训练模块人工智能算法 XGBoost算法账号资产

机电联合作用下的变压器绝缘缺陷诊断方法、装置及计算设备

变压器绝缘缺陷电信号融合特征诊断方法变压器技术

一种基于感知损失和攻击启发的对抗攻击方法

样本残差模块深度卷积神经网络感知损失函数编码器模块

一种基于掩码对比学习预训练的视觉目标跟踪方法

站点导航

APP 下载