一种基于预训练模型的类增量学习方法、系统、设备及介质

正文

推荐专利

申请号：CN202411675135

申请日期：2024-11-21

公开号：CN119377777B

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于预训练模型的类增量学习方法、系统、设备及介质，包括以下步骤；步骤1：在第一阶段的类增量学习中，针对于第一个任务D1，通过提示性信息Prompt嵌入的方法来微调预训练模型ViT；得到微调后的预训练模型；步骤2：对于步骤1得到的微调预训练模型中的嵌入层函数和微调前的预训练模型ViT的嵌入层函数进行合并并且冻结，得到合并模型；步骤3：使用步骤2得到的合并模型从头进行类增量训练，最终得到具有强泛化性和稳健性的类增量模型；步骤4：对于测试样本，使用步骤3得到的类增量模型进行预测，计算最终的分类精度。本发明在保证模型自适应性的同时也保留了模型的泛化能力。

技术关键词

预训练模型增量学习方法注意力分类器原型样本图片键值可读存储介质学习设备学习系统嵌入特征代表模块超参数计算机处理器分块精度

系统为您推荐了相关专利信息

面向长文档的实体关系抽取方法

实体关系抽取方法预训练语言模型注意力标识符实体关系抽取系统

一种基于深度学习的胶囊内窥图像超分辨率重建方法

注意力机制胶囊内窥镜设备轻量化结构多尺度感知损失掩膜

一种基于点云描述符提取的车辆位置识别方法及系统

车辆位置识别方法激光点云数据预训练模型车辆位置识别系统关键帧

一种基于系统安全理论的渔船防碰撞预警方法及系统

防碰撞预警方法渔船皮尔逊相关系数船只船舶

多模态情感识别方法、装置、电子设备和存储介质

情感识别方法音频特征面部特征注意力机制多模态特征

一种基于预训练模型的类增量学习方法、系统、设备及介质

站点导航

APP 下载