基于自适应知识蒸馏的Text-to-SQL生成方法

正文

推荐专利

申请号：CN202510652503

申请日期：2025-05-21

公开号：CN120179677B

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了一种基于自适应知识蒸馏的Text‑to‑SQL生成方法，首先基于目标数据库元数据生成单表SQL语句和对应的自然语言查询文本，并训练一个单表SQL到自然语言的生成模型。接着定义复合规则，将单表数据组合成多表复合查询SQL和对应的自然语言文本，再通过分解复合SQL得到子查询，并生成子查询文本，训练一个多文本到复合文本的生成模型。然后构建生成‑评分‑筛选模块，结合大语言模型和相似度计算，生成并筛选出最优SQL语句，从而得到训练样本数据，训练出基于Transformer的Text‑to‑SQL生成模型。本发明具有样本数据质量高、可实现复合查询SQL语句生成、适应性强、灵活性好等优点。

技术关键词

SQL生成方法语句自然语言文本大语言模型蒸馏深度优先遍历模板模块训练样本数据节点标签元素定义

系统为您推荐了相关专利信息

基于大语言模型的设备管理方法、装置、电子设备和存储介质

自然语言大语言模型管理设备设备管理方法意图识别

合同文件防篡改方法、系统、设备及存储介质

文件防篡改方法动态知识图谱存证数据智能合约验证身份认证信息

基于不同数据源的接口匹配方法、装置及设备

高维特征向量列表参数接口匹配方法消息

一种基于频率调谐的非自然图像理解方法及系统

图像理解方法频率调谐大语言模型文本多模态

一种粗细粒度融合分割与语义连接的RAG增强方法

语义文本意图识别分类器索引

基于自适应知识蒸馏的Text-to-SQL生成方法

站点导航

APP 下载