基于词频概率融合的文本大数据分级分类方法及其系统

正文

推荐专利

申请号：CN202411659664

申请日期：2024-11-20

公开号：CN119149749B

公开日期：2025-04-04

类型：发明专利

摘要

本公开涉及基于词频概率融合的文本大数据分级分类方法及其系统，包括：获取原始文本数据，对原始文本数据进行数据清洗和数据增强操作得到输入数据；根据所述输入数据构建基于概率分布的主题模型，通过基于概率分布的主题模型得到输入数据的主题‑词汇关系，将主题‑词汇关系与词嵌入模型进行特征融合，得到新的词嵌入模型；根据新的词嵌入模型，利用改进Transformer网络模型和卷积神经网络构建深度学习网络模型；对深度学习网络模型进行训练与参数优化，得到训练好的深度学习网络模型；将待分类数据输入训练好的深度学习网络模型中，得到分级分类结果。本公开方法可实现数据精准稳定的分类。

技术关键词

深度学习网络模型分级分类方法主题模型构建深度学习网络卷积模块文本大数据编码器注意力机制关系模型训练模块嵌入特征数据获取模块处理器矩阵

系统为您推荐了相关专利信息

一种融合信号解混与多任务学习的鲜食玉米品质检测方法

鲜食玉米品质玉米籽粒品质组织注意力机制神经网络模型训练

针对电极箔的激光打标方法、装置、计算机设备、可读存储介质和程序产品

激光打标位置激光打标设备轻量化卷积神经网络激光打标方法电极箔

土壤板结处理方法以及装置

吸收峰特征纹理特征孔隙结构特征雷达数据

一种航空航天复合材料损伤可视化特征提取方法

航空航天复合材料特征提取方法损伤特征深度学习网络模型 X射线图像数据

一种基于改进YOLOv8的输电线路异物检测方法

卷积模块空间金字塔池化检测网络模型上下文特征通道注意力机制

基于词频概率融合的文本大数据分级分类方法及其系统

站点导航

APP 下载