摘要
本申请公开了一种基于大语言模型的私有领域Text‑to‑SQL方法及系统,涉及自然语言处理技术,包括:获取原始查询语句;基于提取查询语句的第一Prompt,利用第一大模型提取原始查询语句中的关键语义成分,并进行语义增强;根据语义增强的结果,基于预设用于问答的第二Prompt,利用第二大模型生成SQL的第一问答对;根据语义增强的结果,基于预设用于问答的第三Prompt,利用第一大模型生成包含查询局部信息的第二问答对;基于第一问答对以及第二问答对作为训练集,对第三大模型执行训练。本申请通过知识蒸馏将大语言模型在Text‑to‑SQL任务中的优势高效传递给私有领域应用的小型模型,从而构建高效、低成本、高性能的私有领域Text‑to‑SQL模型。
技术关键词
原始查询语句
大语言模型
语义
上下文查询
训练集
自然语言
同义词
存储器
处理器
高性能
低成本
数据
蒸馏
文本
格式
系统为您推荐了相关专利信息
多语言资源文件
解耦方法
映射技术
标识
动态切换界面
功率分配模型
功率分配策略
协同通信方法
模型更新
车辆对车辆通信
卷积神经网络提取
注意力机制
船舶
窗口技术
时间段