摘要
本公开涉及基于词频概率融合的文本大数据分级分类方法及其系统,包括:获取原始文本数据,对原始文本数据进行数据清洗和数据增强操作得到输入数据;根据所述输入数据构建基于概率分布的主题模型,通过基于概率分布的主题模型得到输入数据的主题‑词汇关系,将主题‑词汇关系与词嵌入模型进行特征融合,得到新的词嵌入模型;根据新的词嵌入模型,利用改进Transformer网络模型和卷积神经网络构建深度学习网络模型;对深度学习网络模型进行训练与参数优化,得到训练好的深度学习网络模型;将待分类数据输入训练好的深度学习网络模型中,得到分级分类结果。本公开方法可实现数据精准稳定的分类。
技术关键词
深度学习网络模型
分级分类方法
主题模型
构建深度学习网络
卷积模块
文本
大数据
编码器
注意力机制
关系
模型训练模块
嵌入特征
数据获取模块
处理器
矩阵
系统为您推荐了相关专利信息
鲜食玉米品质
玉米籽粒品质
组织
注意力机制
神经网络模型训练
激光打标位置
激光打标设备
轻量化卷积神经网络
激光打标方法
电极箔
航空航天复合材料
特征提取方法
损伤特征
深度学习网络模型
X射线图像数据
卷积模块
空间金字塔池化
检测网络模型
上下文特征
通道注意力机制