摘要
本发明涉及自然语言处理技术领域,提供一种基于LLM的复杂语言问句的SQL查询生成方法及系统,包括响应目标语言问句请求;通过语言模型LLM将请求的目标语言问句拆分为一个或多个核心子句转换为语义向量,计算每个核心子句与schema知识文档中每个表的问法向量的匹配得分,根据得分大小和得分阈值进行排序筛选返回核心子句的召回结果;对所有核心子句的召回结果进行合并排序,筛选生成目标语言问句的召回结果;通过Prompt脚本生成的提示词Prompt,并调用语言模型LLM自动生成SQL查询语句。不依赖领域微调、无需重构宽表,通过构造虚拟表及将问句拆分成包含完整语义的子句并进行匹配,有效解决大型语言模型在处理编码值映射、多表和复杂业务逻辑下目标表定位困难的问题。
技术关键词
查询生成方法
语义向量
核心
语句
脚本
字段
列表
意图
映射表信息
离线
数据处理模块
编码器
生成系统
自然语言
数据格式
输出模块
在线
系统为您推荐了相关专利信息
智能测量方法
联合损失函数
Softmax函数
特征提取网络
视觉特征
查询语句生成方法
大语言模型
数据查询方法
对象关系映射模型
指标
加载存储单元
动态仿真平台
功能验证方法
依赖特征
路径特征
BiLSTM模型
推荐方法
推荐算法
dropout算法
学校