一种基于检索增强的视觉模型微调方法

正文

推荐专利

一种基于检索增强的视觉模型微调方法

申请号：CN202510224254

申请日期：2025-02-27

公开号：CN120375021A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于检索增强的视觉模型微调方法，涉及计算机视觉和半监督学习技术领域，提取有标签图像和无标签图像的视觉特征向量；利用BM25检索对有标签图像检索出接近的无标签图像；利用向量检索对有标签图像检索出接近的无标签图像；对检索出的无标签图像即检索图像生成对应的隐式文本特征向量；将有标签图像的视觉特征向量和对应的检索图像的视觉特征向量以及对应的隐式文本特征向量进行融合，得到融合特征；将融合特征输入分类器，通过有标签图像进行监督学习即可完成对视觉模型的训练。本发明通过将检索增强微调方法应用于半监督学习领域，解决了现有技术中无标签数据分布不确定导致的低预测精度问题，为提高半监督学习模型的实际应用效果提供了新的解决方案。

技术关键词

微调方法标签文本特征向量检索图像融合特征图像块特征半监督学习模型监督学习技术频率分类器聚类计算机视觉数据分布参数元素分块索引算法

一种基于检索增强的视觉模型微调方法

站点导航

APP 下载