摘要
本发明提出了一种同时利用图与树结构的图检索增强生成方法,旨在提升基于检索增强生成(RAG)的效率与效果。该方法首先在索引阶段,利用大语言模型对文档块递归地生成摘要树,并基于开源的SpaCy工具构建实体图,同时通过构建双向实体‑文本索引,实现实体与文档块之间的多对多映射。在检索阶段,提出一种轻量化自适应检索策略,根据实体图结构动态选择局部或全局检索路径,从而兼顾查询的粒度与检索效率。实验证明,该方法在不牺牲问答准确率的前提下,实现了索引阶段10倍、检索阶段100倍的速度提升,适用于长文档智能问答等场景。
技术关键词
实体
大语言模型
生成方法
检索策略
索引
摘要
节点
邻居
自然语言
文本
格式化
覆盖率
查询意图
阶段
定义
频率
分块
主题
语义
系统为您推荐了相关专利信息
热处理工艺方法
数字孪生驱动
热处理炉
参数
制动鼓
大语言模型
标注规则
对象
计算机程序指令
计算机程序产品
马尔科夫随机场模型
仿真生成方法
差分隐私
仿真数据
拉普拉斯噪声
报表快速生成方法
自定义模板
生成报表模板
支持向量机算法
意图识别