基于神经崩溃理论的预训练模型类增量学习的识别方法

正文

推荐专利

申请号：CN202411665543

申请日期：2024-11-20

公开号：CN119760495B

公开日期：2025-10-24

类型：发明专利

摘要

本申请提供了一种基于神经崩溃理论的预训练模型类增量学习的识别方法，将NC的理论引入到预训练模型的特征适应中，提供了一种新颖的范式来利用预训练模型解决下游任务。并且本发明构造了一个ETF分类器，能够指导特征表示向最优结构进行适应。ETF分类器不仅满足神经崩溃中的NC2特性，还能通过预先固定最优结构来在训练过程中的不稳定性。引入了FCM模块，以将多种特征压缩到指定的类原型上，减少了类内变异性，并满足神经崩溃的NC1特性，通过监督学习过程，将特征表示与最优分类器结构对齐，从而获得更具判别性的特征表示。本申请对该预训练模型进行增量学习训练，再利用训练后的模型执行目标识别任务可以提高识别效果。

技术关键词

预训练模型适配器识别方法分类器样本模块理论多层感知器内存原型数据标签超参数注意力非线性阶段因子框架图像

基于神经崩溃理论的预训练模型类增量学习的识别方法

站点导航

APP 下载