摘要
本发明属于数据挖掘技术领域,提出了一种基于主题模型的工单数据处理方法、系统、介质和设备,利用训练后的表征提取模型提取出流程类工单数据集,得到第二语料库;基于第二语料库构建第二主题模型,计算流程类工单对应的主题;对每个主题所关联的流程类工单的数量进行统计,选取所关联的流程类工单数量排名为前第六预设名次的主题作为第二工单热点主题;获取原始流程条目数据集,并进行预处理,得到第三语料库和第三词条序列;基于第三词条序列,利用第二主题模型计算得到每个流程条目对应的主题。基于主题模型对语料库进行主题建模,智能提取工单热点主题,将主题与流程条目数据进行关联,有助于各级管理人员针对性地开展优化工作。
技术关键词
主题模型
条目
数据处理方法
主题词条
序列
热点
数据挖掘技术
可视化单元
抽样算法
数据处理系统
核心
计算机
处理器
可读存储介质
列表
存储器
电子设备
系统为您推荐了相关专利信息
问答数据处理方法
融合特征
识别特征
跨模态
多模态特征融合
电子病历
特征提取方法
多模态特征
序列
特征识别模块
多尺度特征融合网络
视频特征提取方法
特征提取模型
空间特征提取
时序特征