摘要
本申请涉及数据库系统与数据治理技术领域,特别是涉及一种基于数据库内核的多源数据关系获取方法。其包括:在解析和分析阶段,提取目标SQL查询语句的表和列信息,并识别表级和列级初始依赖关系;在重写阶段,分析重写是否产生影响,若是,则更新初始依赖关系,得到中间依赖关系;在优化阶段,根据查询树对应的每一路径的初始成本、血缘复杂度、血缘捕获完整程度和预设的血缘影响系数确定目标路径,并根据从目标路径中提取的表级和列级血缘关系对中间依赖关系进行替换或补充,得到静态依赖关系;在执行阶段,捕获动态血缘信息,并将动态血缘信息和静态依赖关系合并,得到目标依赖关系。本发明能提高获取的数据血缘关系的准确性和完整性。
技术关键词
关系获取方法
语句
内存结构
复杂度
数据血缘关系
内核
数据治理技术
阶段
数据库系统
节点
动态
基础
语义
计划
标识符
因子
表达式
列表