一种基于集成学习的文本分类方法

正文

推荐专利

一种基于集成学习的文本分类方法

申请号：CN202411945083

申请日期：2024-12-27

公开号：CN119884377A

公开日期：2025-04-25

类型：发明专利

摘要

本发明涉及一种基于集成学习的文本分类方法，属于文本分类领域，该方法包括：收集样本并标记类别，构建数据集；对本文数据进行预处理；选取三个基分类器采用串联式训练方法，每个基分类器依赖于前一个基分类器在训练过程中产生的特征向量；对训练数据集进行训练，每个基分类器输出对应的置信度；在所述验证数据集上搜索适应于每个所述基分类器的权重，并采用粒子群优化PSO算法对权重进行计算和调节，利用最佳权重对置信度进行加权融合；根据融合后的置信度得到文本数据的分类结果，在得到的多个融合后的置信度中取置信度最高的类别为预测分类结果。本发明所述的方法可以实现特征的多维度提取和有效利用，具有更高的分类准确率和模型泛化能力。

技术关键词

文本分类方法分类器数据神经网络结构词典分类准确率词语样本算法粒子标签分词字符编码标记纠错线性代表关系

系统为您推荐了相关专利信息

基于大语言模型的电子病历后结构化信息提取方法、电子设备及存储介质

电子病历后结构化信息提取方法大语言模型电子病历数据训练样本数据

基于基带芯片标识的终端接入管理方法及通信系统

基带芯片终端接入管理方法终端接入核心网移动性管理标识

一种离散元软件模拟根土复合体影响边坡稳定性的数值模拟方法

根土复合体数值模拟方法路基边坡简化植物边坡模型

一种强干扰环境下MIMO信号调制方式识别方法及系统

格拉斯曼流形强干扰环境张量分析理论生成星座图散射特征

图像处理和模型训练方法、装置、设备和介质

色彩参数图像块特征提取网络输出特征

一种基于集成学习的文本分类方法

站点导航

APP 下载