摘要
本发明揭示一种基于视觉语言模型的无监督图像分类训练方法、系统及介质,涉及计算机技术领域,包括以下步骤:建立无人工标注分类标签的训练数据集D和人工专家标注分类标签的测试集;基于视觉语言模型对训练数据集进行零样本推理,获得伪标签;利用多视角一致性策略对伪标签进行筛选,得到第一训练子集Dir;利用分类‑聚类结果一致性策略筛选,得到第二训练子集Dl;采用高置信度交叉监督学习方法,利用第二训练子集Dl和其余的无标注训练子集Du训练图像分类模型;保存训练得到的图像分类模型对测试集中的样本进行测试,技术效果:不需要人工标注并实现高准确率分类,降低噪声标签对模型训练的负面影响,随机混合的方式训练模型,可增强模型的泛化能力。
技术关键词
图像分类训练方法
图像分类网络
训练图像分类模型
标签
监督学习方法
视觉
样本
匈牙利匹配算法
多视角
训练系统
数据
加权损失函数
图像增强技术
聚类
策略
定义
文本编码器
图像编码器
系统为您推荐了相关专利信息
意图识别模型
脑电信号特征
样本
空间滤波器组
动作融合
损伤识别方法
识别神经网络
传感器标签
分类器
预测误差
动作识别系统
上肢
预处理算法
深度神经网络
数据
噪声传感器
噪声标签
综合地图
三维模型
噪声在线监测
图像分类方法
感知特征
标签
卷积神经网络提取
校准策略