利用标签结构特征的多标签文本分类方法

正文

推荐专利

利用标签结构特征的多标签文本分类方法

申请号：CN202510170287

申请日期：2025-02-17

公开号：CN120123519A

公开日期：2025-06-10

类型：发明专利

摘要

本发明涉及利用标签结构特征的多标签文本分类方法，属于自然语言处理技术领域。本发明首先对所有标签进行GCN编码，对每个文本的多层次标签GCN编码聚合得到标签聚合向量；其次使用BERT对文本编码，计算每个token与聚合向量的交叉注意力分数，选取分数高的部分token拼接为同源正样本；然后计算聚合向量间的余弦相似度，选取除自身外相似度最高的文本作为同类正样本；最后结合文本与同源、同类正样本设计损失函数，训练多标签分类模型。本发明针对现有方法构造正样本时仅将多层标签视为多个独立标签，模型难以学习到标签间层次关系易造成分类误判，通过构造同源、同类正样本增强模型对标签结构的理解，提升分类准确率。

技术关键词

标签文本分类多层标签样本标签结构交叉注意力机制编码多标签 BERT模型分类准确率近邻算法自然语言多层次关系阶段网络参数

系统为您推荐了相关专利信息

一种基于上下文学习和知识图谱的抑郁障碍识别系统

障碍识别系统抑郁大语言模型医学知识图谱量表

一种应用于电动汽车充电负荷预测的方法

序列负荷多层感知器数据编码器

一种基于自监督学习的条纹结构光三维重建方法及装置

三维重建方法条纹结构包裹相位编码器深度学习模型

新能源车载电池健康状态估算方法及装置

新能源车载电池健康状态估算方法 XGBoost模型粒子群优化算法新能源车辆

一种基于云边协同的模型动态训练方法、装置及管控系统

排队模型云端综合能源管控系统变量模型动态训练

利用标签结构特征的多标签文本分类方法

站点导航

APP 下载