基于双低秩适应的视觉-文本预训练模型在开放类别测试时的训练方法和系统

正文

推荐专利

申请号：CN202510303042

申请日期：2025-03-14

公开号：CN120180226A

公开日期：2025-06-20

类型：发明专利

摘要

本发明提供了一种基于双低秩适应的视觉‑文本预训练模型在开放类别测试时的训练方法和系统，包括：在视觉‑文本预训练模型中前馈网络的上采样层嵌入双低秩适应矩阵，即基类和新类低秩适应矩阵，低秩适应技术利用低秩矩阵分解的方法；利用基类低秩适应矩阵让模型在基类数据上训练，通过交叉熵损失函数进行微调；在开放类别测试阶段，利用训练后的基类低秩适应模型对测试数据进行预测，并筛选出低质量预测数据和潜在的新类别数据；通过对新类低秩适应矩阵的调节，逐步适应新类别的数据；根据基类和新类低秩适应模型的联合预测结果，完成分类决策。本发明提高了模型在开放类别环境中的适应性和准确性，能够同时处理已知类别和未见类别的分类任务。

技术关键词

预训练模型矩阵文本编码器 MCM方法预测类别生成图像特征数据分布在线决策样本标签模块视觉特征概念蒸馏可读存储介质网络

基于双低秩适应的视觉-文本预训练模型在开放类别测试时的训练方法和系统

站点导航

APP 下载