摘要
本发明公开了一种基于大模型的自然语言转SQL语句的方法及装置,该方法包括:S1、对原始数据表进行数据治理;S2、对数据库中的所有值构建索引并基于用户问题从数据库中选出相关值,基于最长公共子串匹配算法计算用户问题与相关值之间的匹配程度,选出匹配程度最高的相关值;S3、对用户问题进行改写;S4、对用户问题进行分词匹配;S5、将已积累的种子问答语句存入向量数据库中,对用户问题中的不同关键词进行权重赋值,将用户问题与已积累的种子问答语句进行匹配,选出SQL问答语句;S6、优化DDL语句构建Prompt语句,调用大模型生成SQL语句。本发明极大的提高了大模型生成的SQL语句的质量以及大幅度的提升了用户查询语句的灵活度与SQL语句生成的准确率。
技术关键词
语句
自然语言
索引
种子
关键词
分词
匹配模块
业务表
字典
网络
处理器
算法
通道
可读存储介质
专业
存储器
电子设备
数据
计算机
系统为您推荐了相关专利信息
多维特征向量
医疗诊断方法
人工智能辅助
加权特征值
加权算法