摘要
本发明公开了一种面向高度不平衡文本分类的增强对比学习方法和装置,方法包括步骤:分别对训练数据集和测试数据集中的文本数据进行预处理,得到对应的原始训练文本和测试文本;将原始训练文本和测试文本分别输入RoBERTa模型,获得对应的文本嵌入表示;构造基于数据增强与对比学习的文本分类模型,所述文本分类模型包括文本增强模块、文本表征模块、对比学习模块和文本分类模块;将完成训练和测试的文本分类模型应用于待处理的文本数据的分类处理,输出分类结果。本发明提出了新的自约束堆叠数据增强方法和新的双重加权对比损失函数,能够解决数据不平衡及数据缺乏引发的表征问题,达到了更好的文本分类效果。
技术关键词
文本分类模型
学习方法
模块
样本
多头注意力机制
词语
批量
数据嵌入
学习装置
标签
计算机程序产品
分词
指令
可读存储介质
处理器
算法
参数
系统为您推荐了相关专利信息
综合监测方法
光纤折射率传感器
可信管理
综合监测系统
光纤布拉格光栅
图像分割
分析单元
空间位置偏差
数据分析模块
人机交互模块
咨询服务系统
包装材料
信息存储模块
元素
服务端