一种基于大语言模型的私有领域Text-to-SQL方法及系统

正文

推荐专利

申请号：CN202411650036

申请日期：2024-11-19

公开号：CN119646028A

公开日期：2025-03-18

类型：发明专利

摘要

本申请公开了一种基于大语言模型的私有领域Text‑to‑SQL方法及系统，涉及自然语言处理技术，包括：获取原始查询语句；基于提取查询语句的第一Prompt，利用第一大模型提取原始查询语句中的关键语义成分，并进行语义增强；根据语义增强的结果，基于预设用于问答的第二Prompt，利用第二大模型生成SQL的第一问答对；根据语义增强的结果，基于预设用于问答的第三Prompt，利用第一大模型生成包含查询局部信息的第二问答对；基于第一问答对以及第二问答对作为训练集，对第三大模型执行训练。本申请通过知识蒸馏将大语言模型在Text‑to‑SQL任务中的优势高效传递给私有领域应用的小型模型，从而构建高效、低成本、高性能的私有领域Text‑to‑SQL模型。

技术关键词

原始查询语句大语言模型语义上下文查询训练集自然语言同义词存储器处理器高性能低成本数据蒸馏文本格式

系统为您推荐了相关专利信息

一种温度感知辅助的时间同步保持方法

时间序列预测模型时钟环境温度信息代表节点

一种基于业务元模型的多语资源解耦方法

多语言资源文件解耦方法映射技术标识动态切换界面

一种低功耗车楼协同通信方法及系统

功率分配模型功率分配策略协同通信方法模型更新车辆对车辆通信

基于大模型的智能问答方法、装置、电子设备和存储介质

离散特征智能问答方法融合特征文本对象

一种海上目标航线预测方法

卷积神经网络提取注意力机制船舶窗口技术时间段

一种基于大语言模型的私有领域Text-to-SQL方法及系统

站点导航

APP 下载