基于视觉语言模型的无监督图像分类训练方法、系统及介质

正文

推荐专利

申请号：CN202511096766

申请日期：2025-08-06

公开号：CN120707970A

公开日期：2025-09-26

类型：发明专利

摘要

本发明揭示一种基于视觉语言模型的无监督图像分类训练方法、系统及介质，涉及计算机技术领域，包括以下步骤：建立无人工标注分类标签的训练数据集D和人工专家标注分类标签的测试集；基于视觉语言模型对训练数据集进行零样本推理，获得伪标签；利用多视角一致性策略对伪标签进行筛选，得到第一训练子集Dir；利用分类‑聚类结果一致性策略筛选，得到第二训练子集Dl；采用高置信度交叉监督学习方法，利用第二训练子集Dl和其余的无标注训练子集Du训练图像分类模型；保存训练得到的图像分类模型对测试集中的样本进行测试，技术效果：不需要人工标注并实现高准确率分类，降低噪声标签对模型训练的负面影响，随机混合的方式训练模型，可增强模型的泛化能力。

技术关键词

图像分类训练方法图像分类网络训练图像分类模型标签监督学习方法视觉样本匈牙利匹配算法多视角训练系统数据加权损失函数图像增强技术聚类策略定义文本编码器图像编码器

系统为您推荐了相关专利信息

脑电动作融合交互方法和系统

意图识别模型脑电信号特征样本空间滤波器组动作融合

一种基于自监督学习的分布式损伤识别方法

损伤识别方法识别神经网络传感器标签分类器预测误差

基于肌力信号深度学习的上肢复合动作识别系统

动作识别系统上肢预处理算法深度神经网络数据

一种噪声在线监测与溯源方法

噪声传感器噪声标签综合地图三维模型噪声在线监测

一种基于分布感知特征对齐的半监督域适应图像分类方法

图像分类方法感知特征标签卷积神经网络提取校准策略

基于视觉语言模型的无监督图像分类训练方法、系统及介质

站点导航

APP 下载