一种面向高度不平衡文本分类的增强对比学习方法和装置

AITNT
正文
推荐专利
一种面向高度不平衡文本分类的增强对比学习方法和装置
申请号:CN202411380422
申请日期:2024-09-30
公开号:CN119336916A
公开日期:2025-01-21
类型:发明专利
摘要
本发明公开了一种面向高度不平衡文本分类的增强对比学习方法和装置,方法包括步骤:分别对训练数据集和测试数据集中的文本数据进行预处理,得到对应的原始训练文本和测试文本;将原始训练文本和测试文本分别输入RoBERTa模型,获得对应的文本嵌入表示;构造基于数据增强与对比学习的文本分类模型,所述文本分类模型包括文本增强模块、文本表征模块、对比学习模块和文本分类模块;将完成训练和测试的文本分类模型应用于待处理的文本数据的分类处理,输出分类结果。本发明提出了新的自约束堆叠数据增强方法和新的双重加权对比损失函数,能够解决数据不平衡及数据缺乏引发的表征问题,达到了更好的文本分类效果。
技术关键词
文本分类模型 学习方法 模块 样本 多头注意力机制 词语 批量 数据嵌入 学习装置 标签 计算机程序产品 分词 指令 可读存储介质 处理器 算法 参数
系统为您推荐了相关专利信息
1
算力路由方法、装置及介质
资源 拓扑结构验证 链路 网络拓扑 模块
2
一种变压器油质综合监测方法、系统及存储介质
综合监测方法 光纤折射率传感器 可信管理 综合监测系统 光纤布拉格光栅
3
一种金融信贷风险识别方法及装置
金融 识别方法 画像 职业 训练卷积神经网络模型
4
一种基于SEGVOL的髋关节图像分割分析系统及方法
图像分割 分析单元 空间位置偏差 数据分析模块 人机交互模块
5
一种包装材料咨询服务系统
咨询服务系统 包装材料 信息存储模块 元素 服务端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号