摘要
本申请公开一种基于两阶段检索优化的检索增强生成方法、系统及设备,涉及自然语言处理领域,方法包括:获取用户查询文本及多个知识文档;确定每个知识文档的摘要实体关系三元组集合和句子向量集合;将用户查询文本拆分为多个子查询实体关系三元组;计算子查询实体关系三元组与摘要实体关系三元组集合的摘要检索得分,确定第一阶段检索结果;根据第一阶段检索结果判断是否进行文档全文检索,若进行文档全文检索,则进一步确定每个子查询实体关系三元组的最匹配句子集合,根据所有子查询实体关系三元组及每个子查询实体关系三元组的最匹配句子集合确定回答文本。本申请可拓展文档知识库的知识应用能力和场景,提高回答文本的生成效率和精度。
技术关键词
三元组
实体
生成提示词
两阶段
摘要
生成方法
关系
检索算法
文本
模板
大语言模型
存储模块
生成系统
定义系统
融合算法
自然语言
处理器
指令
计算机设备