文本分类模型优化方法、文本分类方法及装置

正文

推荐专利

申请号：CN202510646723

申请日期：2025-05-20

公开号：CN120561301A

公开日期：2025-08-29

类型：发明专利

摘要

本发明提供一种文本分类模型优化方法、文本分类方法及装置，其方法包括：对原始数据集中的每条文本进行划分，得到文本在不同层级的语义单元；分别对各层级的语义单元采用不同的数据增强方式进行增强，对每条文本得到预设数量的补充文本，并将补充文本整理至原始数据集中，得到增强数据集；基于关键词语义评分和全局语义评分构建偏好奖励函数；在增强数据集上，使用偏好奖励函数对原始文本分类模型进行微调，得到优化后的文本分类模型。本发明通过实现一种多策略细粒度数据增强方法，并时通过构建偏好奖励函数，引入偏好学习使对其在对文本分类模型优化的过程中引导模型训练从而优化得到更具准确性和鲁棒性的文本分类模型。

技术关键词

文本分类模型语义关键词文本分类方法层级数据非暂态计算机可读存储介质注意力机制处理器计算机程序产品优化装置多策略同义词模块存储器鲁棒性定义电子设备

系统为您推荐了相关专利信息

基于信息流转理解的流程图智能解析方法

智能解析方法文本识别语义理解模型箭头分割算法

一种文档实体冲突检测方法及设备

序列标注模型冲突检测方法关系知识库实体数值

基于神经网络的样本自动处理系统及方法

分类神经网络法医物证自动化工作站样本图像处理模块

一种基于LightGBM算法的地震相识别语义分割方法

地震模型语义分割方法 LightGBM模型地震数据体约束特征

压力表异常状态自动分析系统及方法

编码向量压力表融合特征异常状态自动分析方法

文本分类模型优化方法、文本分类方法及装置

站点导航

APP 下载