基于多尺度特征与关联特征的中文短文本分类方法及系统

正文

推荐专利

申请号：CN202411049576

申请日期：2024-08-01

公开号：CN119046405B

公开日期：2025-10-28

类型：发明专利

摘要

本发明公开了一种基于多尺度特征与关联特征的中文短文本分类方法及系统，涉及自然语言处理领域，包括：获取文本数据集合和主题词集合并进行预处理，使用BERT模型提取文本特征，再使用多个不同的卷积层提取文本多尺度语义特征，计算预处理后的文本的关联信息并构建文本图，使用图神经网络提取文本关联特征，使用交叉注意力机制融合文本多尺度语义特征与文本关联特征，得到融合特征，构建文本分类器，将融合特征输入到文本分类器中得到分类结果，评估分类结果，计算评价指标并对文本分类器进行迭代训练，优化文本分类器参数。本发明通过结合文本多尺度语义特征与文本关联特征，实现文本特征的增强，从而进一步提高中文短文本分类准确度。

技术关键词

多尺度语义特征文本分类器词语多尺度特征 BERT模型分类方法交叉注意力机制融合特征节点特征矩阵主题词向量带标签中文分词模型编码器

系统为您推荐了相关专利信息

一种外泌体与视神经损伤预后评估方法及系统

预后评估方法损伤特征焦点损失函数融合多模态信息融合多模态特征

面向互联网的违规广告识别方法、设备及系统

广告识别方法分词字符互联网符号

土壤孔隙二维图像识别方法、装置、电子设备及存储介质

多尺度特征提取图像识别方法编码向量解码模块网络

基于多模态大模型的套餐推荐方法及系统

套餐推荐方法多模态特征语义特征融合特征静态特征

一种基于大数据的服务短信监测方法及系统

服务特征短信监测策略节点特征监测方法

基于多尺度特征与关联特征的中文短文本分类方法及系统

站点导航

APP 下载