摘要
本发明公开了一种基于多样性SQL强化的ICL大语言模型数据查询生成方法及系统,方法包括:S1、确定目标查询数据库,获取数据库Schema;S2、将数据库Schema向量化处理后存储至数据库元信息向量库;S3、将SQL样例集中的SQL语句向量化处理后存储至SQL样例向量库;S4、将存储在SQL样例向量库的信息进行聚类的多样性样例召回;S5、根据数据库概要和用户的自然语言问题,结合召回的样例问题及其对应的SQL查询语句,为模型参考信息,构建一个综合的提示信息,引导大语言模型生成符合语义和语法的SQL查询;S6、输入大语言模型,大语言模型生成SQL语句。本发明通过召回合理的相关信息形成Prompt,引导模型正确生成SQL,能够有效提高大语言模型生成的SQL语句的准确性。
技术关键词
查询生成方法
大语言模型
语句
自然语言
海量文本数据
映射方法
生成系统
词嵌入技术
等待系统
数据库系统
神经网络模型
问答系统
机器翻译
聚类算法
字段
语义
编码
离线