摘要
本发明提供了一种基于增量学习的中文文献分类方法,具体包括:构建中文文献分类问题的基准数据集:构建基于增量学习的中文文献分类的基准模型:使用羊群选择算法选取旧类别中具有代表性的数据,和新类别数据合并,构建增量学习数据集:将增量学习数据集输入到基准模型中,在增量学习损失函数约束下进行训练:使用权重对齐方法对基准模型中的全连接层的输出为新类别的权重进行更新;最后将待分类中文文献输入到全连接层权重对齐后的模型中,进行文本信息识别,得到文献分类结果。本发明可用于鉴定中文文献的类别,使用权重对齐方法和解耦的蒸馏损失函数,使得多分类问题结果更为可靠和可信,降低系统误差。
技术关键词
文献分类方法
预训练语言模型
数据
基准
对齐方法
文本
文献检索系统
ReLU函数
分词算法
注意力
系统误差
定义
矩阵
序列
列表
关键词
编码
摘要
系统为您推荐了相关专利信息
动态客流
编制方法
计划
混合整数规划模型
变邻域搜索算法
语句生成方法
文本生成模型
训练集
命名实体模型
计算机程序产品