摘要
本发明公开了一种基于自适应知识蒸馏的Text‑to‑SQL生成方法,首先基于目标数据库元数据生成单表SQL语句和对应的自然语言查询文本,并训练一个单表SQL到自然语言的生成模型。接着定义复合规则,将单表数据组合成多表复合查询SQL和对应的自然语言文本,再通过分解复合SQL得到子查询,并生成子查询文本,训练一个多文本到复合文本的生成模型。然后构建生成‑评分‑筛选模块,结合大语言模型和相似度计算,生成并筛选出最优SQL语句,从而得到训练样本数据,训练出基于Transformer的Text‑to‑SQL生成模型。本发明具有样本数据质量高、可实现复合查询SQL语句生成、适应性强、灵活性好等优点。
技术关键词
SQL生成方法
语句
自然语言文本
大语言模型
蒸馏
深度优先遍历
模板
模块
训练样本数据
节点
标签
元素
定义
系统为您推荐了相关专利信息
自然语言
大语言模型
管理设备
设备管理方法
意图识别
文件防篡改方法
动态知识图谱
存证数据
智能合约验证
身份认证信息