多模态开放词汇目标检测模型的训练方法及装置

正文

推荐专利

申请号：CN202411650142

申请日期：2024-11-19

公开号：CN119150033A

公开日期：2024-12-17

类型：发明专利

摘要

本申请公开了一种多模态开放词汇目标检测模型的训练方法及装置，涉及计算机视觉技术领域，方法包括：获得训练数据，所述训练数据包括训练图像以及对应的真实标签；基于预训练的图像‑文本匹配模型以及类别无关的区域建议网络确定所述训练图像中待确定目标的伪标签；基于所述伪标签和真实标签，结合混淆原型对比学习算法对检测器进行训练，得到目标检测模型。上述方案利用预训练的区域建议网络和图像‑文本多模态模型生成潜在未知目标的伪标签，再通过混淆原型对比学习来缓解伪标签的噪声对训练产生的负面影响，实现了简单高效的开放词汇目标检测模型的训练。

技术关键词

区域建议网络标签学习算法原型检测头多模态检测器无监督学习计算机视觉技术文本编码器图像编码器模型训练模块聚类数据训练装置

系统为您推荐了相关专利信息

一种基于超像素分割算法的盾构环内地质识别表征方法

超像素分割算法表征方法盾构隧道结构掩码矩阵掘进断面

云计算管理平台系统

管理平台系统检测模型训练数据特征提取数据采集模块数据处理模块

一种充换电用户行为模式分析系统及方法

模式分析系统门控循环单元网络充电站充电桩资源分配车载电池管理系统

一种多模态数据融合方法、装置、设备及介质

数据融合方法数据分类模型 DS证据理论多模态数据融合信息熵

用于部位级图像分割的目标实例部位分割方法

分支分辨率优化候选区域卷积特征特征金字塔网络

多模态开放词汇目标检测模型的训练方法及装置

站点导航

APP 下载