基于词频概率融合的文本大数据分级分类方法及其系统

AITNT
正文
推荐专利
基于词频概率融合的文本大数据分级分类方法及其系统
申请号:CN202411659664
申请日期:2024-11-20
公开号:CN119149749B
公开日期:2025-04-04
类型:发明专利
摘要
本公开涉及基于词频概率融合的文本大数据分级分类方法及其系统,包括:获取原始文本数据,对原始文本数据进行数据清洗和数据增强操作得到输入数据;根据所述输入数据构建基于概率分布的主题模型,通过基于概率分布的主题模型得到输入数据的主题‑词汇关系,将主题‑词汇关系与词嵌入模型进行特征融合,得到新的词嵌入模型;根据新的词嵌入模型,利用改进Transformer网络模型和卷积神经网络构建深度学习网络模型;对深度学习网络模型进行训练与参数优化,得到训练好的深度学习网络模型;将待分类数据输入训练好的深度学习网络模型中,得到分级分类结果。本公开方法可实现数据精准稳定的分类。
技术关键词
深度学习网络模型 分级分类方法 主题模型 构建深度学习网络 卷积模块 文本 大数据 编码器 注意力机制 关系 模型训练模块 嵌入特征 数据获取模块 处理器 矩阵
系统为您推荐了相关专利信息
1
一种融合信号解混与多任务学习的鲜食玉米品质检测方法
鲜食玉米品质 玉米籽粒品质 组织 注意力机制 神经网络模型训练
2
针对电极箔的激光打标方法、装置、计算机设备、可读存储介质和程序产品
激光打标位置 激光打标设备 轻量化卷积神经网络 激光打标方法 电极箔
3
土壤板结处理方法以及装置
吸收峰特征 纹理特征 孔隙结构特征 雷达 数据
4
一种航空航天复合材料损伤可视化特征提取方法
航空航天复合材料 特征提取方法 损伤特征 深度学习网络模型 X射线图像数据
5
一种基于改进YOLOv8的输电线路异物检测方法
卷积模块 空间金字塔池化 检测网络模型 上下文特征 通道注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号