摘要
本发明公开了一种基于标签关系的多标签文本分类方法,涉及自然语言处理技术领域,通过预训练模型捕获文本数据集中的文本特征,根据文本特征获得初始分类排名,得到第一标签序列S1;根据S1中的头部标签,得到第二标签序列S2;将S2与来自给定文本数据集的标签频率共现矩阵M相结合获得第三标签序列S3,由S2与S3取并集获取第四标签序列S4,通过标签频率分布信息对S4中的标签重新排序,得到频率整合的标签序列S,基于S产生一个标签特征序列通过注意机制将与文本建立语义关系获得最终特征fcat;采用最终特征fcat进行最终分类。本发明还公开了一种基于标签关系的多标签文本分类系统,本发明可有效缓解长尾问题,提高最终分类的准确性和相关性。
技术关键词
预训练模型
标签特征
序列
频率
关系
多标签文本分类
矩阵
数据
标记
语义
可读存储介质
机制
处理器
自然语言
计算机设备
超参数
系统为您推荐了相关专利信息
多模态特征融合
亲和力
双向长短期记忆网络
多头注意力机制
中药材活性成分
个性化推荐方法
关键字
实体
门控循环单元网络
图谱
功率芯片
智能功率模块
引线框架
高压驱动芯片
散热基板
接口控制模块
设备访问系统
协议转换模块
阶段
命令
激光定位技术
惯性导航技术
交互系统
激光定位模块
响应等待时间