摘要
本申请公开一种化工事故数据挖掘方法、装置、介质及产品,涉及数据挖掘技术领域,所述方法包括:获取原始事故数据;对原始事故数据进行预处理,得到结构化数据集;利用TF‑IDF算法,基于结构化数据集,确定多个过滤后的关键词的优化后的TF‑IDF值;利用LDA主题模型,基于所有过滤后的关键词的优化后的TF‑IDF值,对各过滤后的关键词进行聚类,得到多个分组,并确定各分组中的所有过滤后的关键词对应的主题;采用SNA,基于所有事故原因关键词,确定各事故原因关键词的性能;基于各事故原因关键词的性能,确定各事故原因关键词的重要性排序。本申请实现了对化工事故报告的数据挖掘。
技术关键词
数据挖掘方法
关键词
数据完整性校验
化工
LDA主题模型
报告
网络节点
分词
数据挖掘技术
处理器
计算机装置
计算机程序产品
算法
聚类
语义
可读存储介质
直方图
存储器
系统为您推荐了相关专利信息
点云特征提取
标定方法
Qt框架
交互式控件
布局管理器
动态脱敏方法
字段
图像识别技术
非易失性计算机可读存储介质
坐标
拆解方法
自然语言
自动化工作流
科研项目管理
语义理解技术