摘要
本发明公开一种基于流程优化的RAG性能提升方法,包括步骤:S1,文本数据预处理;S2,层级化文本分割,获取文档,将文档切分后利用数据库存储文本,将文本转化为向量存入向量知识库中;S3,查询改写,得到改写后的问题;S4,父文档搜索与混合检索结合,对改写后的问题检索相关上下文;S5,重排去噪得到最终上下文;S6,生成答案,将所述最终上下文送入大语言模型进行理解问答。本发明按照数据流动的方向从文本预处理、文本分块、文本嵌入、查询优化、检索、检索后处理和生成等环节依次进行优化,提升语义检索的精度,能够显著提升RAG在文本检索精度、答案生成质量以及用户交互等方面的性能,增强系统的灵活性和实用性,使其在实际应用中表现更为出色。
技术关键词
性能提升方法
文本
大语言模型
分割器
生成答案
纠正错误
关键词
索引
分块
层级
语义
数据
精度
字符
分层
模块
系统为您推荐了相关专利信息
检索方法
大语言模型
检索装置
并行检索系统
内存