摘要
本申请提供了一种基于神经崩溃理论的预训练模型类增量学习的识别方法,将NC的理论引入到预训练模型的特征适应中,提供了一种新颖的范式来利用预训练模型解决下游任务。并且本发明构造了一个ETF分类器,能够指导特征表示向最优结构进行适应。ETF分类器不仅满足神经崩溃中的NC2特性,还能通过预先固定最优结构来在训练过程中的不稳定性。引入了FCM模块,以将多种特征压缩到指定的类原型上,减少了类内变异性,并满足神经崩溃的NC1特性,通过监督学习过程,将特征表示与最优分类器结构对齐,从而获得更具判别性的特征表示。本申请对该预训练模型进行增量学习训练,再利用训练后的模型执行目标识别任务可以提高识别效果。
技术关键词
预训练模型
适配器
识别方法
分类器
样本
模块
理论
多层感知器
内存
原型
数据
标签
超参数
注意力
非线性
阶段
因子
框架
图像