摘要
本申请提供一种基于对比学习的文本可读性分类方法、系统、设备和介质,涉及自然语言处理领域,该方法包括:将获取的第一目标文本输入至预设的BERT模型,通过词嵌入将第一目标文本中的每个词转换为向量表示,得到多个词向量;对多个词向量进行编码确定初始特征向量;通过最大池化提取每个token最重要的单词信息,得到单词级别特征向量序列;基于对比学习来训练模型,得到成熟的目标分类器。本申请引入对比学习框架训练模型,训练过程既考虑整个句子的理解和语义信息的编码,也考虑单词级别的细节信息,增强模型对可读性细微差别的识别能力;本申请基于对比学习来学习文本的通用表示,提高了模型在不同数据集和应用场景下的特征集可移植性。
技术关键词
BERT模型
分类方法
文本
分类器
标签类别
训练语言模型
序列
Softmax函数
语义
可读存储介质
样本
分类系统
处理器
编码器
注意力机制
表达式
编码模块
程序
系统为您推荐了相关专利信息
语义
高分辨率遥感影像变化检测
特征提取模块
融合特征
多级特征融合
纹理特征
航海雷达图像
遗传算法
切片
因子分析方法
文本检测模型
图像
识别方法
特征金字塔
非易失性计算机可读存储介质
人工智能技术
信息数据处理终端
Boost模型
液相
梯度提升决策树