一种基于词频的窗口增强特征融合文本分类方法

正文

推荐专利

申请号：CN202510597032

申请日期：2025-05-09

公开号：CN120541224A

公开日期：2025-08-26

类型：发明专利

摘要

本发明涉及一种基于词频的窗口增强特征融合文本分类方法，属于中文文本分类技术领域。该方法通过数据预处理和命名实体识别，将文本中的高频和低频词分别处理，高频词直接使用预训练词向量表示，并引入权重；低频词通过窗口增强方法提取上下文信息。通过特征融合，将高频词的词向量和低频词经过增强处理后的上下文特征进行有效融合，提升了文本的语义表示能力。采用改进型多通道卷积神经网络提取多粒度语义特征，并引入注意力机制强化关键信息。训练过程中使用焦点损失函数(Focal Loss)解决类别不平衡问题。该方法显著提高了分类准确度，尤其在处理类别不平衡和复杂文本数据时表现出更高的鲁棒性和精度。

技术关键词

多通道卷积神经网络文本分类方法焦点损失函数滑动窗口机制命名实体识别训练词向量模型中文文本分类融合注意力机制引入注意力机制上下文特征停用词表数据标签语义特征鲁棒性汉字字母

系统为您推荐了相关专利信息

基于大语言模型的金融融资规划方案提供系统

金融大语言模型规划矩阵文本

基于物联网的有限空间气体监测方法、系统、设备及介质

气体监测方法传感节点混合预测模型长短期记忆神经网络数据交换格式

一种文章逻辑关系自动分析方法及系统

自动分析方法语义相关度分类词库文章逻辑

基于CNN-LSTM模型的融合气象空间特征的臭氧预测方法

LSTM模型气象臭氧空间特征提取空气质量预测技术

一种基于时间加权的碳排放预测方法

排放预测方法训练人工智能模型策略深度神经网络模型电力

一种基于词频的窗口增强特征融合文本分类方法

站点导航

APP 下载