摘要
本发明提供了一种自然语言转SQL翻译的自动错误检测与修复方法及系统,以自然语言查询与SQL查询匹配的正确性条件——执行一致性为基础,对给定的自然语言和原始SQL查询,为自然语言查询生成多个候选SQL查询,并使用SQL等价性验证技术尝试为不等价的SQL查询之间生成反例,利用大语言模型和数据库执行引擎分别在反例上执行自然语言和SQL查询,若自然语言与原始SQL查询的执行结果不一致,则判定该自然语言转SQL翻译存在错误;若同时存在候选SQL查询在反例上的执行结果与自然语言更匹配,则以该候选SQL作为修复结果。本发明可以自动检测并修复现有Text‑to‑SQL数据集中的错误翻译,提供更高质量的训练、测试数据集,同时还能用于Text‑to‑SQL模型翻译任务中,提高翻译准确性。
技术关键词
自然语言
错误检测
大语言模型
修复方法
模糊测试技术
数据库引擎
生成数据库
句法结构
修复系统
模块
级联方式
关键词
格式
基础
系统为您推荐了相关专利信息
大语言模型
意图识别模型
文本关键词提取
答案
图谱
训练数据生成方法
多智能体协作
计算机程序产品
数据生成装置
样本