摘要
本发明公开了一种分层检索增强生成方法及系统。其中,方法包括根据分层检索增强生成任务确定待检索的问题信息;基于问题信息对外部知识库进行文档级检索,获得最相关的文档集;对最相关的文档集按照段落进行切块并进行段落级检索,获得最相关的段落集;对最相关的段落集按照句子进行切块并进行句子级检索,获得最相关的句子集;利用滑动窗口对最相关的句子集中的每个句子进行片段生成操作后,再进行片段级检索,获得最相关的片段集;利用大型语言模型对最相关的片段集及模型内部知识进行信息整合,并利用基于外部知识图谱所获取的事实性知识进行上下文信息补充,获得问题信息的上下文回答文本。本发明方案可显著提高了检索结果的准确性和可靠性。
技术关键词
生成方法
文本
切块
分层
预训练语言模型
滑动窗口
生成系统
处理器
图谱
序列
字符
参数
频率
算法
存储器
编码
代表
系统为您推荐了相关专利信息
图纸
数据分类模型
电气
计算机执行指令
数据处理方法