摘要
本公开提供了一种基于机器学习的多源异构数据分析方法,属于数据治理技术领域。该方法通过对多源异构数据库中的数据流转日志进行解析与处理,并结合图数据库存储血缘信息集中的第一流转路径和节点依赖关系,实现了血缘信息的可视化与可追溯,让数据来源和流转脉络清晰透明。通过确定各个流转节点之间的动态关联关系集,能动态捕捉流转节点间关联关系,及时发现不一致依赖关系,并定位不一致依赖字段。通过不一致依赖字段确定错误字段,以进行修复错误字段,生成修复数据集合,并根据修复数据集合构建第二数据流转路径,在验证路径完整性通过后,生成优化后的血缘信息集,如此有效提升了血缘信息的准确性,使其能够准确捕捉数据流转的实时变化。
技术关键词
异构数据分析方法
节点依赖关系
训练特征
数据库结构
字段
数据清洗算法
遍历算法
日志
深度优先搜索算法
重构算法
数据治理技术
协方差矩阵
参数
增量学习算法
模块
数据分析系统
特征值
系统为您推荐了相关专利信息
openflow流表
浮动IP地址
IP网关
网桥
集中式路由器
模糊查询加密方法
元数据管理
数据加密方法
语句
查询特征