摘要
本发明涉及一种文本检索增强生成方法、系统、终端设备及可读存储介质,方法包括:文本处理:读取原始文档中的格式信息,然后根据格式信息和大语言模型对原始文档进行层次化切分,按内容的含义将每篇原始文档的内容片段组织成一个树形数据结构形式的文档内容树;构建索引:将内容片段中的文字片段和所在的文档内容树上所有上级节点的内容拼接成新的文本,然后进行向量化作为索引;信息检索:将所有检索到的文字片段和所在的文档内容树上相关的节点拼接成意义完整的文本提供给大语言模型。本发明改善了检索不到问题相关内容或检索到的相关内容不完整、检索到太多无关内容导致大语言模型无法从提示词中提取到有用信息以及回答不完整等情况。
技术关键词
生成方法
读取原始文档
大语言模型
树形数据结构
信息检索
节点
计算机可读指令
文本
格式
终端设备
索引
组织
生成系统
处理器
层级
可读存储介质
存储器
模块
表格
图片
系统为您推荐了相关专利信息
知识库构建方法
大语言模型
样本
组合存储模块
计算机程序产品
多模态信息辅助
图像特征向量
对象
重识别方法
图像特征提取
信息知识图谱
漏洞信息收集方法
补丁
存储计算机程序
节点