摘要
本申请公开了一种多模态开放词汇目标检测模型的训练方法及装置,涉及计算机视觉技术领域,方法包括:获得训练数据,所述训练数据包括训练图像以及对应的真实标签;基于预训练的图像‑文本匹配模型以及类别无关的区域建议网络确定所述训练图像中待确定目标的伪标签;基于所述伪标签和真实标签,结合混淆原型对比学习算法对检测器进行训练,得到目标检测模型。上述方案利用预训练的区域建议网络和图像‑文本多模态模型生成潜在未知目标的伪标签,再通过混淆原型对比学习来缓解伪标签的噪声对训练产生的负面影响,实现了简单高效的开放词汇目标检测模型的训练。
技术关键词
区域建议网络
标签
学习算法
原型
检测头
多模态
检测器
无监督学习
计算机视觉技术
文本编码器
图像编码器
模型训练模块
聚类
数据
训练装置
系统为您推荐了相关专利信息
超像素分割算法
表征方法
盾构隧道结构
掩码矩阵
掘进断面
管理平台系统
检测模型训练
数据特征提取
数据采集模块
数据处理模块
模式分析系统
门控循环单元网络
充电站
充电桩资源分配
车载电池管理系统
数据融合方法
数据分类模型
DS证据理论
多模态数据融合
信息熵
分支
分辨率
优化候选区域
卷积特征
特征金字塔网络