一种基于词频的窗口增强特征融合文本分类方法

AITNT
正文
推荐专利
一种基于词频的窗口增强特征融合文本分类方法
申请号:CN202510597032
申请日期:2025-05-09
公开号:CN120541224A
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及一种基于词频的窗口增强特征融合文本分类方法,属于中文文本分类技术领域。该方法通过数据预处理和命名实体识别,将文本中的高频和低频词分别处理,高频词直接使用预训练词向量表示,并引入权重;低频词通过窗口增强方法提取上下文信息。通过特征融合,将高频词的词向量和低频词经过增强处理后的上下文特征进行有效融合,提升了文本的语义表示能力。采用改进型多通道卷积神经网络提取多粒度语义特征,并引入注意力机制强化关键信息。训练过程中使用焦点损失函数(Focal Loss)解决类别不平衡问题。该方法显著提高了分类准确度,尤其在处理类别不平衡和复杂文本数据时表现出更高的鲁棒性和精度。
技术关键词
多通道卷积神经网络 文本分类方法 焦点损失函数 滑动窗口机制 命名实体识别 训练词向量模型 中文文本分类 融合注意力机制 引入注意力机制 上下文特征 停用词表 数据 标签 语义特征 鲁棒性 汉字 字母
系统为您推荐了相关专利信息
1
基于大语言模型的金融融资规划方案提供系统
金融 大语言模型 规划 矩阵 文本
2
基于物联网的有限空间气体监测方法、系统、设备及介质
气体监测方法 传感节点 混合预测模型 长短期记忆神经网络 数据交换格式
3
一种文章逻辑关系自动分析方法及系统
自动分析方法 语义相关度 分类词库 文章 逻辑
4
基于CNN-LSTM模型的融合气象空间特征的臭氧预测方法
LSTM模型 气象 臭氧 空间特征提取 空气质量预测技术
5
一种基于时间加权的碳排放预测方法
排放预测方法 训练人工智能模型 策略 深度神经网络模型 电力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号