基于错误反馈的NL2SQL大模型训练数据合成方法、系统及存储介质

正文

推荐专利

申请号：CN202510977089

申请日期：2025-07-16

公开号：CN121009104A

公开日期：2025-11-25

类型：发明专利

摘要

本发明提供了一种基于错误反馈的NL2SQL大模型训练数据合成方法、系统及存储介质，该方法包括：步骤1：识别种子问答对中的实体，这些实体包括数据库中的Schema区域以及自然语言中的实体；步骤2：利用RAG技术在知识库中匹配与问题和实体相关的知识；步骤3：根据获得的知识和实体信息生成相应的SQL查询，并将其转化为自然语言问题；步骤4：对生成的SQL问答对进行质量评估，确保NL‑SQL问答对加入训练集，而出现错误的NL‑SQL问答对将反馈至NL‑SQL问答生成环节。本发明的有益效果是：提升了自然语言问题的流畅性和可理解性，确保生成的SQL语句的准确性和与问题的契合性。

技术关键词

自然语言实体语句向量检索技术合成器错误检测数据语义可读存储介质大语言模型训练集处理器表格阶段种子存储器计算机条目分词记忆

系统为您推荐了相关专利信息

一种智能咨询交互方法、装置、设备及存储介质

智能交互机器人交互方法自然语言理解可读存储介质对象

一种基于多头自注意力与层次化增强的多文档问答方法及设备

问答方法注意力层级大语言模型数据

一种在线医疗问答动态检索增强生成方法

答案医疗实体识别语义向量生成方法标识符

基于知识图谱的多智能体协作医疗诊断方法和装置

医学知识图谱医疗诊断方法多智能体协作诊断系统报告

一种基于迁移学习的智能导购语音识别方法及系统

预训练语言模型语音识别方法自然语言理解模型查询意图语音识别系统

基于错误反馈的NL2SQL大模型训练数据合成方法、系统及存储介质

站点导航

APP 下载