摘要
本发明公开了一种基于多尺度特征与关联特征的中文短文本分类方法及系统,涉及自然语言处理领域,包括:获取文本数据集合和主题词集合并进行预处理,使用BERT模型提取文本特征,再使用多个不同的卷积层提取文本多尺度语义特征,计算预处理后的文本的关联信息并构建文本图,使用图神经网络提取文本关联特征,使用交叉注意力机制融合文本多尺度语义特征与文本关联特征,得到融合特征,构建文本分类器,将融合特征输入到文本分类器中得到分类结果,评估分类结果,计算评价指标并对文本分类器进行迭代训练,优化文本分类器参数。本发明通过结合文本多尺度语义特征与文本关联特征,实现文本特征的增强,从而进一步提高中文短文本分类准确度。
技术关键词
多尺度语义特征
文本分类器
词语
多尺度特征
BERT模型
分类方法
交叉注意力机制
融合特征
节点特征
矩阵
主题词向量
带标签
中文分词模型
编码器
系统为您推荐了相关专利信息
预后评估方法
损伤特征
焦点损失函数
融合多模态信息
融合多模态特征
多尺度特征提取
图像识别方法
编码向量
解码模块
网络
套餐推荐方法
多模态特征
语义特征
融合特征
静态特征