摘要
本发明涉及一种基于词频的窗口增强特征融合文本分类方法,属于中文文本分类技术领域。该方法通过数据预处理和命名实体识别,将文本中的高频和低频词分别处理,高频词直接使用预训练词向量表示,并引入权重;低频词通过窗口增强方法提取上下文信息。通过特征融合,将高频词的词向量和低频词经过增强处理后的上下文特征进行有效融合,提升了文本的语义表示能力。采用改进型多通道卷积神经网络提取多粒度语义特征,并引入注意力机制强化关键信息。训练过程中使用焦点损失函数(Focal Loss)解决类别不平衡问题。该方法显著提高了分类准确度,尤其在处理类别不平衡和复杂文本数据时表现出更高的鲁棒性和精度。
技术关键词
多通道卷积神经网络
文本分类方法
焦点损失函数
滑动窗口机制
命名实体识别
训练词向量模型
中文文本分类
融合注意力机制
引入注意力机制
上下文特征
停用词表
数据
标签
语义特征
鲁棒性
汉字
字母
系统为您推荐了相关专利信息
气体监测方法
传感节点
混合预测模型
长短期记忆神经网络
数据交换格式
LSTM模型
气象
臭氧
空间特征提取
空气质量预测技术
排放预测方法
训练人工智能模型
策略
深度神经网络模型
电力