摘要
本发明属于文档检索技术领域,具体涉及基于检索增强生成的文档检索方法、系统、设备及介质。针对现有文档检索中采用大语言模型时会因为幻觉问题生成不正确或误导性信息的不足,本发明采用如下技术方案:基于检索增强生成的文档检索方法包括:为特定的数据库设定初始查询;构建包括检索器和大语言模型的检索增强生成模型,采用检索器和初始查询对数据库中的文档进行检索,计算查询‑文档对齐分数并排序,根据排序结果得到相关文档集;将初始查询与相关文档集输入检索增强生成模型的大语言模型,生成优化查询,并重新检索得到优化文档集;将优化文档集和优化查询输入大语言模型并输出最终回答。本发明的文档检索方法能够提升检索准确度。
技术关键词
文档检索方法
大语言模型
文档检索系统
文档检索技术
生成同义词
生成对用户
关键词
语句
查询意图
注意力机制
频率
自然语言
计算机设备
输出模块
语义
可读存储介质
处理器
编码器
系统为您推荐了相关专利信息
信息编码器
文字特征
大语言模型
多尺度
场景理解方法
文本
异常检测方法
大语言模型
训练集
神经网络模型
自动化评估方法
大语言模型
摘要
自动化评估系统
生成代码