基于视觉语言模型噪声标签优化的图像分类方法

正文

推荐专利

申请号：CN202510501324

申请日期：2025-04-21

公开号：CN120451634A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种基于视觉语言模型噪声标签优化的图像分类方法，包括：获取待处理图像并输入图像分类模型，获得分类结果；其中，图像分类模型基于高质量样本集训练得到。在筛选高质量样本的过程中，第一阶段利用CLIP模型，结合宏观、微观文本提示来计算每个样本图像的损失值，通过两分量的高斯混合模型拟合各样本图像的损失值，从而根据两个分布确定混淆样本的上、下界，划分得到干净样本、混淆样本和噪声样本；第二阶段，采用不同策略确定三种样本的伪标签，将每个样本图像与其伪标签输入BLIP模型，计算二者的相似度分数，以筛选出高质量样本。本发明可以在保证标签质量的同时减轻图像分类模型的自我确认偏差，使图像分类模型具有良好的鲁棒性。

技术关键词

图像分类方法噪声标签噪声样本图像分类模型高斯混合模型图像特征向量文本编码器视觉预测类别后验概率策略鲁棒性偏差

系统为您推荐了相关专利信息

输电场景下模型解释方法、系统、介质、程序产品及设备

模型解释方法场景可读存储介质计算机程序产品 K均值聚类算法

图像分类模型的增量训练方法和图像分类方法

图像分类模型增量训练方法滑动窗口图像分类方法曲线

基于先验知识的测试时适应图像质量评价方法、系统、终端及介质

评价方法评价图像样本矩阵评价系统

智能座舱多模态感知数据融合方法、系统、装置及介质

音频特征信息数据融合方法图像特征信息智能座舱双层长短期记忆网络

一种用于患者整形烧伤的康复护理计划方法及系统

混合整数规划模型深度强化学习算法不确定性模型策略闭环反馈机制

基于视觉语言模型噪声标签优化的图像分类方法

站点导航

APP 下载