摘要
本发明涉及一种基于长文本的检索增强生成方法,包括以下步骤:S1文本解析拆分;S2使用向量化模型将文本转变成向量;S3搜索算法;S4确定文本块的优先级,并增加更多的上下文信息;S5添加相邻文本块;S6大语言模型将合并后的文本块作为输入,利用大语言模型生成最终的响应或内容;S7大语言模型根据输入的文本块和相邻文本块生成答案。本发明通过对现有RAG系统进行改进,提高针对长文本场景下RAG系统的准确率。加强RAG的能力,达到提升RAG系统生成答案质量的目的。
技术关键词
文本
生成方法
大语言模型
相似性判断方法
搜索算法
生成答案
数据库管理系统
解析工具
硬件系统
生成系统
存储系统
场景
操作系统
模块
服务器
索引
格式
芯片