一种基于长文本的检索增强生成方法及系统

正文

推荐专利

一种基于长文本的检索增强生成方法及系统

申请号：CN202411831411

申请日期：2024-12-12

公开号：CN120011489A

公开日期：2025-05-16

类型：发明专利

摘要

本发明涉及一种基于长文本的检索增强生成方法，包括以下步骤：S1文本解析拆分；S2使用向量化模型将文本转变成向量；S3搜索算法；S4确定文本块的优先级，并增加更多的上下文信息；S5添加相邻文本块；S6大语言模型将合并后的文本块作为输入，利用大语言模型生成最终的响应或内容；S7大语言模型根据输入的文本块和相邻文本块生成答案。本发明通过对现有RAG系统进行改进，提高针对长文本场景下RAG系统的准确率。加强RAG的能力，达到提升RAG系统生成答案质量的目的。

技术关键词

文本生成方法大语言模型相似性判断方法搜索算法生成答案数据库管理系统解析工具硬件系统生成系统存储系统场景操作系统模块服务器索引格式芯片

一种基于长文本的检索增强生成方法及系统

站点导航

APP 下载