多模态开放词汇目标检测模型的训练方法及装置

AITNT
正文
推荐专利
多模态开放词汇目标检测模型的训练方法及装置
申请号:CN202411650142
申请日期:2024-11-19
公开号:CN119150033A
公开日期:2024-12-17
类型:发明专利
摘要
本申请公开了一种多模态开放词汇目标检测模型的训练方法及装置,涉及计算机视觉技术领域,方法包括:获得训练数据,所述训练数据包括训练图像以及对应的真实标签;基于预训练的图像‑文本匹配模型以及类别无关的区域建议网络确定所述训练图像中待确定目标的伪标签;基于所述伪标签和真实标签,结合混淆原型对比学习算法对检测器进行训练,得到目标检测模型。上述方案利用预训练的区域建议网络和图像‑文本多模态模型生成潜在未知目标的伪标签,再通过混淆原型对比学习来缓解伪标签的噪声对训练产生的负面影响,实现了简单高效的开放词汇目标检测模型的训练。
技术关键词
区域建议网络 标签 学习算法 原型 检测头 多模态 检测器 无监督学习 计算机视觉技术 文本编码器 图像编码器 模型训练模块 聚类 数据 训练装置
系统为您推荐了相关专利信息
1
一种基于超像素分割算法的盾构环内地质识别表征方法
超像素分割算法 表征方法 盾构隧道结构 掩码矩阵 掘进断面
2
云计算管理平台系统
管理平台系统 检测模型训练 数据特征提取 数据采集模块 数据处理模块
3
一种充换电用户行为模式分析系统及方法
模式分析系统 门控循环单元网络 充电站 充电桩资源分配 车载电池管理系统
4
一种多模态数据融合方法、装置、设备及介质
数据融合方法 数据分类模型 DS证据理论 多模态数据融合 信息熵
5
用于部位级图像分割的目标实例部位分割方法
分支 分辨率 优化候选区域 卷积特征 特征金字塔网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号