基于对比学习的文本可读性分类方法、系统、设备和介质

正文

推荐专利

申请号：CN202411502818

申请日期：2024-10-25

公开号：CN119474971A

公开日期：2025-02-18

类型：发明专利

摘要

本申请提供一种基于对比学习的文本可读性分类方法、系统、设备和介质，涉及自然语言处理领域，该方法包括：将获取的第一目标文本输入至预设的BERT模型，通过词嵌入将第一目标文本中的每个词转换为向量表示，得到多个词向量；对多个词向量进行编码确定初始特征向量；通过最大池化提取每个token最重要的单词信息，得到单词级别特征向量序列；基于对比学习来训练模型，得到成熟的目标分类器。本申请引入对比学习框架训练模型，训练过程既考虑整个句子的理解和语义信息的编码，也考虑单词级别的细节信息，增强模型对可读性细微差别的识别能力；本申请基于对比学习来学习文本的通用表示，提高了模型在不同数据集和应用场景下的特征集可移植性。

技术关键词

BERT模型分类方法文本分类器标签类别训练语言模型序列 Softmax函数语义可读存储介质样本分类系统处理器编码器注意力机制表达式编码模块程序

语义高分辨率遥感影像变化检测特征提取模块融合特征多级特征融合

一种基于特征融合和遗传算法的航海雷达油膜检测方法及系统

纹理特征航海雷达图像遗传算法切片因子分析方法

图像文本的识别方法及其装置、电子设备以及程序产品

文本检测模型图像识别方法特征金字塔非易失性计算机可读存储介质

基于人工智能技术识别液-液相分离调节蛋白的方法及系统

人工智能技术信息数据处理终端 Boost模型液相梯度提升决策树

问答场景的检索增强方法、装置、设备和存储介质

脱敏数据问答场景还原数据加密算法

基于对比学习的文本可读性分类方法、系统、设备和介质

站点导航

APP 下载