摘要
本发明涉及一种基于跨模态一致性循环的目标检测模型训练方法,包括以下步骤:采集目标检测图像并生成图像样本集与对应文本样本集;用二者联合训练目标检测模型,并在每轮内执行视觉‑文本、文本‑视觉跨模态一致性循环;对每张图像提取原始特征,经视觉‑文本循环得第一文本与第一视觉特征,再经文本‑视觉循环得第二文本;计算两循环损失;在轮前计算文本提示样本使用比例,从文本样本集中选取对应比例的文本提示标签作为第一文本;综合两损失得总损失,直至总损失低于设定阈值,输出训练完成模型。
技术关键词
检测模型训练方法
跨模态
无标签样本
文本生成器
视觉特征
文本编码器
图像编码器
基础
检测头
模块
处理器
存储器
电子设备
网络
系统为您推荐了相关专利信息
回环检测方法
地点
特征描述符
特征金字塔
视觉特征
医学图像分割网络
无监督深度学习
迭代升级功能
荧光
跨模态
多模态数据融合
情感识别方法
客服
多模态数据采集
情感识别模型
视频智能推送方法
语义向量
风险评估模型
文本特征向量
内容库