摘要
本发明涉及一种基于大模型和检索增强的表格问答方法,包括如下步骤:选用CodeLLaMA‑7B‑Instruct‑hf,利用LoRA技术进行参数微调得到LLMforTable;构建多模态知识库,对多模态知识库中非结构化文档转换为纯文本,按语义粒度分块使用Sentence‑BERT将文本转化为768维知识向量;将用户输入的自然语言问题转换为向量,与知识向量计算相似度,选取相似度大于阈值且按降序排列的前Top‑K个相似度所对应的知识向量,然后再将提取Top‑K个知识向量对应的知识片段;制作结构化提示Prompt,将Prompt作为LLMforTable的输入,输出SQL语句。
技术关键词
预训练模型
问答方法
正确率
自然语言
语句
样本
表格
多模态
基础
文本
参数
数据
策略
分块
语义
矩阵
阶段
模式
旁路
索引