摘要
本发明一种基于树近邻上下文的大语言模型RAG优化方法,包括,读取文档的目录结构和内容,生成对应的目录树并转换为包含标题和级别的Markdown格式,若无标题则根据文档模板自动提取;按照优先级将文档切分为知识块;在召回知识块后,使用树邻近上下文方法扩充上下文,形成新的知识块列表;将扩充后的知识块按照文档标识分组和排序,基于不同的字段和置信度拼接参考资料,生成来自原始文档的字符串集合;使用构造的参考资料和新的知识块列表,拼接提示词并发送给大模型进行处理。本发明该方案通过优化上下文信息、强调重点内容、适配多种文档格式以及提升用户体验等方式,全面增强了大模型在信息检索和回答生成过程中的性能和实用性。
技术关键词
目录
语义
列表
节点
标识
检索方法
格式
自然语言
识别主题
生成答案
摘要
模板
信息检索
逻辑
关键词
字段
概念
文本
代表