摘要
本发明涉及一种文献数据多标签自动分类方法及系统,采用两种不同的模型:一种是擅长捕捉文本序列信息的长期短期记忆网络,另一种是能够有效提取文本局部特征的卷积神经网络,这两种模型分别独立地对文本进行特征提取。随后,提取出的特征通过特定的融合策略进行整合,再经过MLP进行进一步的特征压缩和抽象,最终得出文本的分类结果。通过将这两种特性融合在一起,本方法旨在确保最终提取的特征同时具备时间和空间上的丰富性,从而显著提升文本分类的性能,特别是对于那些存在类型交叉现象的复杂文本。相较于传统人工分类以及当下借助大模型应用提示词工程分类的方法相比,本文提出的方法更为快捷。
技术关键词
自动分类方法
多标签
自动分类系统
文本
BERT模型
数据
多尺寸卷积核
爬虫技术
标注方法
记忆单元
构建分类模型
关键词
序列
多层感知器
可视化模块
摘要
网络
依赖特征
融合策略
系统为您推荐了相关专利信息
文本分割方法
分支
图像全局特征
交叉注意力机制
编码模块
模型训练方法
词向量模型
文本特征向量
模型更新
解密
异常检测方法
表达式
样本
dice损失函数
点云