一种基于树近邻上下文的大语言模型RAG优化方法

正文

推荐专利

申请号：CN202411817803

申请日期：2024-12-11

公开号：CN119293195B

公开日期：2025-03-25

类型：发明专利

摘要

本发明一种基于树近邻上下文的大语言模型RAG优化方法，包括，读取文档的目录结构和内容，生成对应的目录树并转换为包含标题和级别的Markdown格式，若无标题则根据文档模板自动提取；按照优先级将文档切分为知识块；在召回知识块后，使用树邻近上下文方法扩充上下文，形成新的知识块列表；将扩充后的知识块按照文档标识分组和排序，基于不同的字段和置信度拼接参考资料，生成来自原始文档的字符串集合；使用构造的参考资料和新的知识块列表，拼接提示词并发送给大模型进行处理。本发明该方案通过优化上下文信息、强调重点内容、适配多种文档格式以及提升用户体验等方式，全面增强了大模型在信息检索和回答生成过程中的性能和实用性。

技术关键词

目录语义列表节点标识检索方法格式自然语言识别主题生成答案摘要模板信息检索逻辑关键词字段概念文本代表

一种基于树近邻上下文的大语言模型RAG优化方法

站点导航

APP 下载