一种基于融合特征和改进LSTM的文本分类方法

正文

推荐专利

申请号：CN202510144644

申请日期：2025-02-10

公开号：CN120030160A

公开日期：2025-05-23

类型：发明专利

摘要

本发明公开了一种基于融合特征和改进LSTM的文本分类方法，包括获取文本数据，并划分为训练集和测试集；对文本进行预处理，得到清洗后的文本数据；使用Word2Vec方法提取文本的特征，得到静态特征向量；使用预训练的BERT中文模型提取文本的特征，得到包含上下文的特征向量；将静态特征向量和包含上下文的特征向量进行融合，得到融合特征；将训练集的融合特征输入至改进的LSTM网络进行模型训练；使用训练好的分类模型对测试集进行分类验证，以评估模型的效能；该方法旨在通过结合静态和动态特征向量，不仅利用了两者的优势，还通过注意力机制优化了输入特征的权重分配，加强了模型对关键信息的关注，本发明适用于各种需要高精度文本分类的领域。

技术关键词

文本分类方法 Word2Vec模型融合特征注意力机制 Softmax函数协方差矩阵 BERT模型词嵌入向量成分分析法数据邮件序列效能动态地网络特征值编码

系统为您推荐了相关专利信息

一种面向多场景适配的企业税务自动化处理方法

面向多场景涉税数据特征向量空间动态权重分配权重分配策略

一种基于多模态学习的超短期光伏功率预测方法

数据编码器多模态学习方法解码器时间段序列特征

一种基于扩散模型的小样本字体生成方法

字体生成方法风格噪声图像编码器表达式

一种基于对比学习的毫米波波束跟踪方法

波束跟踪方法激光雷达数据特征提取模块激光雷达信息激光雷达传感器

一种中药材自动分类系统

自动分类系统输出模块混合损失函数多尺度特征提取置信度阈值

一种基于融合特征和改进LSTM的文本分类方法

站点导航

APP 下载