摘要
本发明公开了一种智能化大数据平台的数据清洗方法,涉及互联网与大数据技术领域,解决的是信息数据格式多样、结构复杂和实时处理速度过慢的问题;数据清洗方法,包括获取移动终端反馈的海量信息数据;根据终端类型和数据采集时间将海量信息数据划分为若干个子数据块;按照事件业务类型,将每个子数据块内的信息数据进行分类和分级;根据各业务数据格式标准,将完成数据分类的信息数据进行格式检验和数据清洗;提取信息数据的关键信息,并验证信息数据关联性;合并所有子数据块及具有关联性的信息数据;根据事件紧迫度,将完成合并的信息数据进行排序;通过混沌校验码完成移动终端的身份校验,通过内容清洗模型将信息数据的内容进行自动纠错。
技术关键词
海量信息数据
数据清洗方法
大数据平台
移动终端
数据采集模块
数据格式
数据分类
特征值
降维特征
标识
医疗保健信息
社会安全事件
通道
校验单元
清洗单元
公共卫生事件
个人隐私信息
系统为您推荐了相关专利信息
数据预测方法
矩阵
计算机可读指令
主成分分析法
时间段
水合物反应釜
智能监测系统
数据采集模块
天然气
远程监测平台
RGB传感器
无菌环境
采样瓶
控制单元
模型训练模块
图像数据集合
智能控制系统
裂纹
打印图像数据
图像分析模块