摘要
本发明提供一种文本分类模型优化方法、文本分类方法及装置,其方法包括:对原始数据集中的每条文本进行划分,得到文本在不同层级的语义单元;分别对各层级的语义单元采用不同的数据增强方式进行增强,对每条文本得到预设数量的补充文本,并将补充文本整理至原始数据集中,得到增强数据集;基于关键词语义评分和全局语义评分构建偏好奖励函数;在增强数据集上,使用偏好奖励函数对原始文本分类模型进行微调,得到优化后的文本分类模型。本发明通过实现一种多策略细粒度数据增强方法,并时通过构建偏好奖励函数,引入偏好学习使对其在对文本分类模型优化的过程中引导模型训练从而优化得到更具准确性和鲁棒性的文本分类模型。
技术关键词
文本分类模型
语义
关键词
文本分类方法
层级
数据
非暂态计算机可读存储介质
注意力机制
处理器
计算机程序产品
优化装置
多策略
同义词
模块
存储器
鲁棒性
定义
电子设备
系统为您推荐了相关专利信息
智能解析方法
文本识别
语义理解模型
箭头
分割算法
序列标注模型
冲突检测方法
关系
知识库实体
数值
分类神经网络
法医物证
自动化工作站
样本
图像处理模块
地震模型
语义分割方法
LightGBM模型
地震数据体
约束特征
编码向量
压力表
融合特征
异常状态
自动分析方法