基于增量学习的中文文献分类方法

正文

推荐专利

基于增量学习的中文文献分类方法

申请号：CN202510022875

申请日期：2025-01-07

公开号：CN119939428B

公开日期：2025-08-15

类型：发明专利

摘要

本发明提供了一种基于增量学习的中文文献分类方法，具体包括：构建中文文献分类问题的基准数据集：构建基于增量学习的中文文献分类的基准模型：使用羊群选择算法选取旧类别中具有代表性的数据，和新类别数据合并，构建增量学习数据集：将增量学习数据集输入到基准模型中，在增量学习损失函数约束下进行训练：使用权重对齐方法对基准模型中的全连接层的输出为新类别的权重进行更新；最后将待分类中文文献输入到全连接层权重对齐后的模型中，进行文本信息识别，得到文献分类结果。本发明可用于鉴定中文文献的类别，使用权重对齐方法和解耦的蒸馏损失函数，使得多分类问题结果更为可靠和可信，降低系统误差。

技术关键词

文献分类方法预训练语言模型数据基准对齐方法文本文献检索系统 ReLU函数分词算法注意力系统误差定义矩阵序列列表关键词编码摘要

系统为您推荐了相关专利信息

一种伺服作动系统三余度信号表决方法

伺服作动系统表决方法无故障信号航空飞行器

一种红树林生态修复恢复效果的评估预测方法

评估预测方法红树林生态模拟模型特征值

基于动态客流的城市轨道交通列车运行计划集成编制方法

动态客流编制方法计划混合整数规划模型变邻域搜索算法

SQL语句生成方法、装置、电子设备、介质及程序产品

语句生成方法文本生成模型训练集命名实体模型计算机程序产品

可疑交易的监控方法、装置和交易监控系统

交易特征交易监控系统数据客户机器学习模型

基于增量学习的中文文献分类方法

站点导航

APP 下载