摘要
本发明提供一种大模型指标查询智能问数方法,属于自然语言处理与数据库查询领域,本发明构建辅助信息库以存储数据库结构和历史问答示例,通过将自然语言问题进行结构化格式处理提取关键实体与字段,利用少量示例指导的大语言模型生成接近SQL语法的中间表达和多个SQL查询候选,并设计一致性对齐机制对候选SQL在字段匹配、聚合函数和数据表等方面进行校验以筛选出最优SQL查询。最终生成的正确SQL及其对应的问答对被反馈回辅助信息库,实现自学习增强。该方法在仅需少量训练示例的情况下提高了大语言模型文本生成SQL查询的准确性和可扩展性。
技术关键词
数据库结构
命名实体识别技术
生成自然语言
SQL语法
字段
抽象语法树
格式化
查询意图
指标
大语言模型
语义
样本
语句
文本
机制
关系