摘要
本发明提供了一种基于数据依赖关系的血缘分析方法、电子设备及介质,涉及数据血缘分析技术领域,方法包括:根据每一SQL语句对应的所有的表名和字段名,生成每一SQL语句对应的SQL语句向量;以得到SQL语句向量列表A;对A中的所有SQL语句向量进行聚类,以得到簇列表B;解析Bj中每一SQL语句提取对应的表名、字段名和操作类型,建立Bj中SQL语句的表名和字段名之间的字段级血缘关系图Xj;建立B对应的跨簇血缘映射表QR;对B中的簇进行融合,以得到全局血缘关系分析图QW;以分层交互式视图展示QW;本发明解决了传统血缘分析方法在准确性、效率与可用性上的瓶颈,为大规模数据治理提供了高效、可靠的技术支撑。
技术关键词
血缘分析方法
数据依赖关系
语句
节点
列表
Word2Vec模型
字典
索引
字段
词法分析器
语法分析器
肘部法则
电子设备
聚类
可读存储介质
分层
处理器
树根