摘要
本发明涉及数据管理与知识图谱领域,提供了一种基于大模型的民政数据血缘知识图谱的构造方法、装置,该方法包括:基于民政数据的元数据特征提取构建基础实体网络;基于基础实体网络,对数据表结构解析,生成数据表结构关系模型;解析复杂结构化查询语言语句,识别字段级血缘关联,生成初步的血缘关系图谱;然后遍历所有物理源表,消除虚拟表冗余和数据节点重复,生成优化后的血缘关系图谱;基于优化后的血缘关系图谱,识别公共数据节点并合并字段级数据血缘,生成最终的民政数据血缘关系图谱。本发明解决了现有技术中难以准确解析复杂SQL语句、处理虚拟表冗余和数据节点重复问题的问题,实现了高精度、自动化的民政数据血缘知识图谱构建。
技术关键词
结构化查询语言
抽象语法树
数据表结构
数据血缘关系
复杂度特征
节点
数据特征提取
广度优先搜索
实体
基础
非暂态计算机可读存储介质
冗余
网络
知识图谱构建
字段
系统为您推荐了相关专利信息
可逆转换器
深度学习模型
重构模型
抽象语法树
节点
代码结构
大语言模型
多模态
生成代码
文本编码器
自然语言
访问控制信息
云平台服务
语句
结构化查询语言
数据迁移
上下文感知技术
补丁
数据格式
修复装置
自动化管控方法
静态代码分析
关系
语义
抽象语法树