一种基于跨模态一致性循环的目标检测模型训练方法

正文

推荐专利

申请号：CN202511061260

申请日期：2025-07-30

公开号：CN120931905A

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及一种基于跨模态一致性循环的目标检测模型训练方法，包括以下步骤：采集目标检测图像并生成图像样本集与对应文本样本集；用二者联合训练目标检测模型，并在每轮内执行视觉‑文本、文本‑视觉跨模态一致性循环；对每张图像提取原始特征，经视觉‑文本循环得第一文本与第一视觉特征，再经文本‑视觉循环得第二文本；计算两循环损失；在轮前计算文本提示样本使用比例，从文本样本集中选取对应比例的文本提示标签作为第一文本；综合两损失得总损失，直至总损失低于设定阈值，输出训练完成模型。

技术关键词

检测模型训练方法跨模态无标签样本文本生成器视觉特征文本编码器图像编码器基础检测头模块处理器存储器电子设备网络

系统为您推荐了相关专利信息

基于2D-3D混合特征增强的视觉地点识别与回环检测方法

回环检测方法地点特征描述符特征金字塔视觉特征

缺陷检测模型训练方法、装置、设备及存储介质

文本检测模型训练方法样本网络图像编码

一种基于无监督深度学习的荧光图像分割方法及自我-群体迭代升级装置

医学图像分割网络无监督深度学习迭代升级功能荧光跨模态

一种基于多模态数据融合的客服人员情感识别方法及系统

多模态数据融合情感识别方法客服多模态数据采集情感识别模型

个性化宣教视频智能推送方法及相关装置

视频智能推送方法语义向量风险评估模型文本特征向量内容库

一种基于跨模态一致性循环的目标检测模型训练方法

站点导航

APP 下载