摘要
本发明公开了一种非结构化数据内容抽取分析方法、装置、设备及存储介质,该方法包括:获取目标数据源中的非结构化数据,并对非结构化数据预处理,得到预处理数据;对预处理数据进行文本解析和/或特征提取,得到非结构化数据对应的关键信息;基于预设分析方式对关键信息进行分析,得到非结构化数据对应的关联分析结果,其中,预设分析方式包括语义分析、主题建模和关联规则挖掘中的至少一种。本发明的技术方案,解决了传统的结构化数据处理方法无法实现对非结构化数据分析的技术问题,实现了从非结构化数据中提取关键信息,并通过智能算法实现内容之间的关联分析,从而为数据驱动决策、知识管理等领域提供有力支持。
技术关键词
分析方法
文本
数据清洗工具
语义分析技术
主题
命名实体识别
处理器
数据分析模块
可读存储介质
建模算法
组件技术
数据获取模块
数据处理模块
计算机
智能算法
分析装置
电子设备