摘要
本发明涉及一种基于大语言模型的政务数据质量检核规则生成方法及系统,属于数据质量检核技术领域,解决了现有数据质量检核规则需要技术人员参与,无法自动快速地生成和自适应调整的问题。方法包括:获取待检核的目标表及其中各目标字段的元数据信息;依次取出每个目标字段,根据目标表和目标字段的元数据信息获取字段语义向量、联合语义向量、字段结构向量和/或枚举值向量,进而从政务知识图谱中检索相似度最大的历史字段的知识片段;当知识片段不为空时,根据目标表和目标字段的元数据信息以及知识片段构建动态提示词,传入大语言模型中生成目标字段的数据质量检核规则。实现了自动化快速生成数据质量检核规则。
技术关键词
语义向量
规则生成方法
大语言模型
字段
政务
数据
索引
图谱
模板
规则生成系统
SQL语法
动态
列表
模块
基座
精度
基础
系统为您推荐了相关专利信息
电网基建项目
智能评审方法
大语言模型
统计特征
字符
行政区划信息
问答系统
数据库查询语句
政务
语义