摘要
本发明涉及一种基于摘要树的大数据差异检测方法,具体涉及大数据分析领域,将大数据集按照时间序列和地理位置进行划分,对每个大数据块应用哈希函数生成唯一的哈希值,作为该大数据块的唯一标识符并表示为大数据块摘要,将生成的大数据块摘要作为节点从下至上采用平衡二叉树算法构建一棵摘要树,利用深度优先方式逐层比较摘要树的节点,判断摘要树结构并比较两个摘要树节点的摘要信息,分析两个大数据集的摘要树存在的差异原因,反馈具体的差异数据,并创建可视化界面展示差异点的位置和数据内容,利用Z‑score算法实现存储数据集转换为具有零均值和单位标准差的标准正态分布,在选定的数据库管理系统中创建三维差异数据存储表实现数据存储管理。
技术关键词
摘要
差异检测方法
节点
大数据
平衡二叉树
创建可视化界面
数据库管理系统
数据存储管理
交互式可视化
信息比
数据库表结构
算法
标识符
邻居
标记
序列
因子
系统为您推荐了相关专利信息
钢管混凝土结构
结构设计方法
约束钢管
结构设计参数
结构安全系数
风险评估方法
动态仿真模型
分布式传感器
数字孪生
仿真环境
故障预测模型
粒子群优化算法
电力传输路径
功率分配策略
深度学习算法