摘要
本发明提出了一种基于双通道语义增强和卷积神经网络的文本分类方法,包括以下步骤:S1,先对文本进行预处理和词向量嵌入,得到文本矩阵X;S2,将生成的文本矩阵X分别采用Conv1D、AtrousConv1D进行双通道卷积特征提取,得到原始语义信息C和全局文本信息A;S3,对生成的原始语义信息C和全局文本信息A采用加权平均注意力生成注意力得分Cscore和Ascore,同时对文本矩阵X进行语义增强得到yk,最后将高维的卷积特征图拼接,然后将拼接后的特征图通过Linear全连接层和Sofrmax层映射为标签的概率分布。本发明能够适用于中文和英文文本分类任务,且在长文本和短文本种都具有良好的分类性能和泛化能力。
技术关键词
文本分类方法
语义
注意力
卷积特征提取
矩阵
中文文本
训练语料库
标签
通道
生成特征
非线性
信道
语句
索引
滤波器
汉字
符号