摘要
本申请涉及元数据生成技术领域,其公开了一种基于大模型的数据平台元数据自动生成方法,其首先对原始SQL代码进行统一标准化和初步语法分析,以获取结构化中间表示。在此基础上,进行基于规则的初步血缘分析,快速识别并处理简单列引用。对于那些传统方法难以准确解析的复杂表达式,则将其代码片段及其上下文信息精确提取,并交由大语言模型进行深度语义理解与复杂血缘解析。最终,将大模型解析出的复杂血缘与初步血缘列表进行整合,形成全面且精确的字段级血缘关系,进而生成完整的数据平台元数据。这样,有效地弥补了传统解析工具对复杂语义理解的不足,显著提升了元数据生成的准确性和完整性。
技术关键词
数据自动生成方法
数据平台
SQL解析器
表达式
列表
空间权重矩阵
节点
语义
解码参数
大语言模型
数据生成技术
文本
抽象语法树
解析工具
标识
格式化
特征值
系统为您推荐了相关专利信息
应力测试方法
综合加速因子
可靠度模型
控制稳压电源
表达式
杂波协方差矩阵
雷达
概率密度函数
虚警概率
表达式
阀门粘滞补偿
非线性控制方法
控制回路
变量
进化算法
复原算法
哈特曼波前传感器
微透镜阵列
波前斜率
光束