摘要
一种自然语言转SQL语句的方法,包含以下步骤:S1:根据表描述文件构建向量数据库和行业知识图谱;S2:构建行业领域的实体数据集,用于训练BERT模型;实体数据集包含实体名称和实体分类;S3:通过BERT模型对自然语句进行实体内容标注,得到标注后语句;查询知识图谱,对标注后语句进行文本替换,得到替换后语句;S4:向量化表征替换后语句,得到待检索语句;在向量数据库中检索待检索语句,并得到对应的表结构信息;S5:根据表结构信息,通过大语言模型生成SQL语句。本发明提高了特定领域自然语言转SQL语句的准确性。
技术关键词
语句
自然语言
BERT模型
大语言模型
行业知识图谱
实体
文本
数据
格式
逻辑