摘要
本发明涉及基于预训练大模型的Text‑to‑SQL复杂查询语句生成方法和系统,方法包括:获取包括用户问题和数据库中表名和列名的词典解释的输入序列;将用户问题和词典解释分别输入Sentence‑BERT模型,获取与用户问题最相关Top‑K个解释,根据最相关Top‑K个解释,获取增强输入序列;将增强输入序列进行编码,生成增强语义向量,根据增强语义向量构建层次化数据库模式图;将层次化数据库模式图输入超图神经网络模型进行节点特征更新,获取优化后的节点特征;根据优化后的节点特征,获取结构化查询语句。本发明能够更好地处理复杂查询场景下多表之间的复杂关联和多层次查询逻辑,提升在复杂查询场景下的性能。
技术关键词
查询语句生成方法
结构化查询语句
节点特征
语义向量
BERT模型
神经网络模型
词典
序列
查询场景
模式
编码
训练集
注意力机制
邻居
自然语言
多层次
模块
解码器