基于对比学习的文本可读性分类方法、系统、设备和介质

AITNT
正文
推荐专利
基于对比学习的文本可读性分类方法、系统、设备和介质
申请号:CN202411502818
申请日期:2024-10-25
公开号:CN119474971A
公开日期:2025-02-18
类型:发明专利
摘要
本申请提供一种基于对比学习的文本可读性分类方法、系统、设备和介质,涉及自然语言处理领域,该方法包括:将获取的第一目标文本输入至预设的BERT模型,通过词嵌入将第一目标文本中的每个词转换为向量表示,得到多个词向量;对多个词向量进行编码确定初始特征向量;通过最大池化提取每个token最重要的单词信息,得到单词级别特征向量序列;基于对比学习来训练模型,得到成熟的目标分类器。本申请引入对比学习框架训练模型,训练过程既考虑整个句子的理解和语义信息的编码,也考虑单词级别的细节信息,增强模型对可读性细微差别的识别能力;本申请基于对比学习来学习文本的通用表示,提高了模型在不同数据集和应用场景下的特征集可移植性。
技术关键词
BERT模型 分类方法 文本 分类器 标签类别 训练语言模型 序列 Softmax函数 语义 可读存储介质 样本 分类系统 处理器 编码器 注意力机制 表达式 编码模块 程序
系统为您推荐了相关专利信息
1
一种基于语义引导的交叉注意力网络的高分辨率遥感影像变化检测方法、系统、设备及介质
语义 高分辨率遥感影像变化检测 特征提取模块 融合特征 多级特征融合
2
一种基于特征融合和遗传算法的航海雷达油膜检测方法及系统
纹理特征 航海雷达图像 遗传算法 切片 因子分析方法
3
图像文本的识别方法及其装置、电子设备以及程序产品
文本检测模型 图像 识别方法 特征金字塔 非易失性计算机可读存储介质
4
基于人工智能技术识别液-液相分离调节蛋白的方法及系统
人工智能技术 信息数据处理终端 Boost模型 液相 梯度提升决策树
5
问答场景的检索增强方法、装置、设备和存储介质
脱敏数据 问答场景 还原数据 加密 算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号