一种面向高度不平衡文本分类的增强对比学习方法和装置

正文

推荐专利

申请号：CN202411380422

申请日期：2024-09-30

公开号：CN119336916A

公开日期：2025-01-21

类型：发明专利

摘要

本发明公开了一种面向高度不平衡文本分类的增强对比学习方法和装置，方法包括步骤：分别对训练数据集和测试数据集中的文本数据进行预处理，得到对应的原始训练文本和测试文本；将原始训练文本和测试文本分别输入RoBERTa模型，获得对应的文本嵌入表示；构造基于数据增强与对比学习的文本分类模型，所述文本分类模型包括文本增强模块、文本表征模块、对比学习模块和文本分类模块；将完成训练和测试的文本分类模型应用于待处理的文本数据的分类处理，输出分类结果。本发明提出了新的自约束堆叠数据增强方法和新的双重加权对比损失函数，能够解决数据不平衡及数据缺乏引发的表征问题，达到了更好的文本分类效果。

技术关键词

文本分类模型学习方法模块样本多头注意力机制词语批量数据嵌入学习装置标签计算机程序产品分词指令可读存储介质处理器算法参数

系统为您推荐了相关专利信息

算力路由方法、装置及介质

资源拓扑结构验证链路网络拓扑模块

一种变压器油质综合监测方法、系统及存储介质

综合监测方法光纤折射率传感器可信管理综合监测系统光纤布拉格光栅

一种金融信贷风险识别方法及装置

金融识别方法画像职业训练卷积神经网络模型

一种基于SEGVOL的髋关节图像分割分析系统及方法

图像分割分析单元空间位置偏差数据分析模块人机交互模块

一种包装材料咨询服务系统

咨询服务系统包装材料信息存储模块元素服务端

一种面向高度不平衡文本分类的增强对比学习方法和装置

站点导航

APP 下载