摘要
本申请涉及数据管理技术领域,公开一种用于确定数据血缘关系的方法,包括:获取多源异构数据;获取多源异构数据对应的目标元数据,以及各目标元数据之间的依赖关系;将目标元数据作为节点,依赖关系作为边,构建初始数据血缘图谱;获取初始数据血缘图谱中各节点的节点嵌入;根据各节点的节点嵌入,确定候选节点对之间的依赖关系情况;根据初始数据血缘图谱和依赖关系情况,获得目标数据血缘图谱。该方法能够发现和捕捉隐藏的或未明确定义的隐性数据关系,从而识别到初始数据血缘图谱中未被识别的依赖关系,进而提高了确定数据血缘关系的准确率。本申请还公开一种用于确定数据血缘关系的装置及电子设备。
技术关键词
多源异构数据
数据血缘关系
节点
图谱
重构误差
语义特征
数据管理技术
电子设备
模块
邻域
处理器
数值
程序
指令
存储器
策略
定义
系统为您推荐了相关专利信息
聚类
数据挖掘方法
计算机可读取存储介质
节点
计算机可读指令
实体关联方法
上下文语义信息
词嵌入模型
搜索方法
预训练语言模型
优化规划方法
综合配电系统
储能系统
可平移负荷
新能源发电机组