摘要
本发明涉及一种基于LLM和RAG的电力领域Text2SQL数据解析方法,与现有技术相比解决了RAG技术因为没有特定领域的向量化模型,以及知识库种类和维度的单一,导致检索结果包含噪音和冗余,使其大模型仍然出现大量幻觉现象的缺陷。本发明包括以下步骤:构建电力领域Text2SQL数据解析方法的数据集;构建电力领域Text2SQL数据解析方法的多维度的文本知识库;电力领域Text2SQL数据解析方法的LLM底座微调;构建电力领域Text2SQL数据解析方法的RAG检索模块;构建电力领域Text2SQL数据解析方法的Agent数据解析模块并进行数据解析处理。本发明基于RAG的技术使得大语言模型可以通过检索获取电力领域Text2SQL数据解析所需的相关信息,同时以知识库形式存储的领域数据保证了数据的私密性和可及时更新,以提示工程为主要的基于LLM的Text2SQL数据解析方法也大大降低了模型训练成本,通过混合检索参数设置使得检索结果具有较高的准确性,确保了Text2SQL数据解析的效果。
技术关键词
数据解析方法
问答对数据
语句
电力
检索算法
自检模块
关键词
底座微调
文本
索引
大语言模型
抓取模块
融合算法
自然语言
工作流
字段
格式