摘要
本发明提供一种基于数据血缘关系的字段级数据治理方法及系统,涉及数据处理技术领域,方法包括:获取待处理数据中各个字段的上游数据和下游数据;将上游数据和下游数据作为样本数据构建数据血缘图谱;确定各个字段之间的上下游血缘关系;确定各个字段的基础可信度评分、时效性权重评分以及规则校验分;构建可信度模型;将样本数据输入至可信度模型进行训练;获取待处理数据的实时样本数据;将实时样本数据输入至训练后的可信度模型,输出最终可信度;根据最终可信度对待处理数据进行数据治理;将数据治理结果标记为样本数据,再次输入至可信度模型进行训练。本发明可以实现数据的精细化治理,提高数据质量和可用性。
技术关键词
数据血缘关系
可信度模型
数据治理方法
时效性
样本
计算机可读指令
数据治理系统
数据处理技术
图谱
基础
字段
存储器
处理器
标记
校正
变量
系统为您推荐了相关专利信息
链路设计方法
传感器节点
多无人机
数据中心
策略
患病风险预测方法
数据
样本
时间段
模型训练方法