一种基于注意力机制和对比学习相结合的短文本聚类方法及系统

正文

推荐专利

申请号：CN202510391850

申请日期：2025-03-31

公开号：CN120316267A

公开日期：2025-07-15

类型：发明专利

摘要

一种基于注意力机制和对比学习相结合的短文本聚类方法及系统，它属于自然语言处理与机器学习交叉技术领域。本发明解决了现有对比学习方法存在假负例分离，导致后期聚类准确率低的问题。本发明提出的基于样本层面的注意力机制用于挖掘样本之间的语义相似度。根据语义相似度，采用加权重识别的方式优化了对比学习中正例样本的构建，解决了对比学习具备的假负例分离问题，从而利用改进后的对比学习更好的训练模型，生成更高质量的特征向量。之后，本发明采用概率分布对比学习和伪标签辅助训练相结合的方式训练聚类网络，实现更准确的聚类。本发明方法可以应用于短文本聚类。

技术关键词

数据样本集合文本特征提取器注意力机制网络标签聚类模块矩阵机器学习交叉技术参数学习方法元素自然语言语义编码代表

系统为您推荐了相关专利信息

基于人工智能的意图识别方法、装置、计算机设备及介质

意图识别方法意图识别模型语音计算机可读指令数据

心理咨询数据处理方法、系统、电子设备

数据处理方法动态协作会话网络心理量表

一种基于图强化学习的多AGV分布式路径规划方法

协同路径规划路径规划方法多头注意力机制节点特征异构

一种多γ源方位反演方法、装置、设备及存储介质

方位反演方法特征提取模块反演模型卷积神经网络训练数值模拟方法

基于AI算法的作文数据处理方法及系统

学生 AI算法数据处理方法问答模型可执行程序代码

一种基于注意力机制和对比学习相结合的短文本聚类方法及系统

站点导航

APP 下载