摘要
本发明公开了一种适用于复杂存储过程的数据血缘构建方法,属于数据处理技术领域;具体包括:解析待分析数据库存储过程源代码,获取原始SQL语句集合、过程内部及跨过程的调用关系结构、语句的上下文层级结构信息、数据库表标识符与字段标识符,字段在其所属语句中的语法结构位置标识、语法结构单元标识;将字段划分为输入字段或输出字段;将结构化语句拆分为语句片段,识别片段的字段级依赖关系并标注类型;构建字段粒度数据血缘图和表粒度数据血缘图。本发明的有益效果是:本发明能够显著提升血缘关系识别的准确性与覆盖率,减少对规则配置与人工分析的依赖,增强数据血缘分析在大规模数据系统中的可行性。
技术关键词
语法结构
语句
数据血缘构建方法
标识符
字段
关系
层级
表达式
语义场景
节点
查询场景
动态
数据处理技术
嵌套结构
分支
参数
逻辑
分析方法