摘要
本发明属于政务数据管理领域,具体涉及一种基于政务系统结构化及非结构化数据的清洗分析方法,调用结构化数据进行预处理并提取特征,建立可关联的特征字段表;调用非结构化数据进行解析转换,获取解析转换后数据的关键词段;关键词段与特征字段表通过关联规则的AI模型进行关联,对应特征挂载在对应关键词段形成索引指针;索引指针汇总建立用于检索的索引库,通过索引库进行数据的检索定位。建立特征字段表、解析非结构化数据,将非结构化数据中的关键词段与结构化数据的特征字段进行组合关联,建立索引库且提供数据检索入口,快速定位关联数据,充分利用结构化数据和非结构化数据。
技术关键词
政务系统
关键词
分析方法
索引
指针
语音转换技术
数据模块
文本
字段
数据管理
分析系统
数据同步
音频
视频
标识
组织
图像
语义