一种基于标签关系的多标签文本分类方法及系统

正文

推荐专利

申请号：CN202510020631

申请日期：2025-01-07

公开号：CN119938924B

公开日期：2025-06-17

类型：发明专利

摘要

本发明公开了一种基于标签关系的多标签文本分类方法，涉及自然语言处理技术领域，通过预训练模型捕获文本数据集中的文本特征，根据文本特征获得初始分类排名，得到第一标签序列S1；根据S1中的头部标签，得到第二标签序列S2；将S2与来自给定文本数据集的标签频率共现矩阵M相结合获得第三标签序列S3，由S2与S3取并集获取第四标签序列S4，通过标签频率分布信息对S4中的标签重新排序，得到频率整合的标签序列S，基于S产生一个标签特征序列通过注意机制将与文本建立语义关系获得最终特征fcat；采用最终特征fcat进行最终分类。本发明还公开了一种基于标签关系的多标签文本分类系统，本发明可有效缓解长尾问题，提高最终分类的准确性和相关性。

技术关键词

预训练模型标签特征序列频率关系多标签文本分类矩阵数据标记语义可读存储介质机制处理器自然语言计算机设备超参数

系统为您推荐了相关专利信息

一种基于多模态特征融合的化合物-靶标结合亲和力预测方法

多模态特征融合亲和力双向长短期记忆网络多头注意力机制中药材活性成分

基于人工智能的教育课程个性化推荐方法及系统

个性化推荐方法关键字实体门控循环单元网络图谱

智能功率模块

功率芯片智能功率模块引线框架高压驱动芯片散热基板

一种Flash设备访问系统和方法

接口控制模块设备访问系统协议转换模块阶段命令

基于激光定位技术和惯性导航技术的虚拟数字人交互系统

激光定位技术惯性导航技术交互系统激光定位模块响应等待时间

一种基于标签关系的多标签文本分类方法及系统

站点导航

APP 下载