摘要
本发明公开了一种基于机器学习的数据治理方法及系统,本发明首先获取初始待治理数据,对所述初始待治理数据进行标准化预处理;将预处理后的待治理数据进行分类,并确定每类待治理数据之间的因果关系构建定数据因果关系概化图;根据数据因果关系概化图利用深度学习构建数据模拟模型和数据重构模型;确定待治理数据种类,待治理数据种类包括点修复和路径修复;根据待治理数据种类使用数据模拟模型和数据重构模型对预处理后的待治理数据进行修复,从而进行数据治理。本发明通过考虑数据之间的因果性构建数据因果关系概化图揭示数据之间的内在联系和规律,并根据数据因果关系概化图采取不同的修复策略,提高了数据治理的灵活性和准确性。
技术关键词
数据治理方法
模拟模型
序列
重构模型
灰色关联度
有向无环图
神经网络模型构建
节点
数据治理系统
结构方程模型
连续点
模糊神经网络
计算机可执行指令
注意力机制
模块
策略
软件
理论