针对长尾噪声的模型训练方法、装置、设备和介质

正文

推荐专利

申请号：CN202510345862

申请日期：2025-03-24

公开号：CN119888412B

公开日期：2025-07-08

类型：发明专利

摘要

本发明涉及计算机视觉技术领域，特别涉及针对长尾噪声的模型训练方法、装置、设备和介质，方法包括将输入图像、文本提示词和观测标签输入预训练的视觉语言模型中，视觉语言模型的图像编码器中设置有微调模块；在视觉语言模型中得到文本特征、图像特征及对各个类别的原始输出值，并得到文本预测标签；确定监督启停状态和目标损失函数，并基于目标损失函数对微调模块进行更新，以得到完成训练的视觉语言模型。本申请通过评估文本预测标签和观察标签之间的差异确定是否需要文本图像对齐先验辅助监督，通过校准学习到的特征和观测标签之间的偏差，进而提高了头部类和尾部类样本在高噪声场景下的分类准确率。

技术关键词

模型训练方法图像编码器标签文本编码器噪声数据计算机视觉技术模型训练装置分类准确率可读存储介质特征提取模块处理器输入模块存储器

系统为您推荐了相关专利信息

一种基于多模态信息融合的医学报告生成方法及系统

多模态信息融合报告生成方法疾病文本编码器生成医学报告

一种模型训练方法、中尺度涡识别方法和应用

模型训练方法权重特征样本识别方法人工智能方法

电力架空线路故障识别方法及系统

架空线路故障有效性故障特征识别方法数据

一种施工现场智能管理系统

RFID读写器施工现场智能施工智能出入库信息设备管理模块

基于深度学习的学生学习成果预测方法

主特征提取注意力门控循环网络学生预训练语言模型

针对长尾噪声的模型训练方法、装置、设备和介质

站点导航

APP 下载