摘要
本发明公开了一种基于大语言模型检索增强生成的方法、系统、设备及介质,该方法包括:将文本文件分片,得到多个父文本块,并为每个父文本块生成唯一标识,将所有父文本块及其对应的唯一标识存入关系型数据库;将每个父文本块再次分片得到多个子文本块,对每个父文本块进行文本总结,得到多个父文本块总结文本;针对每个父文本块生成一个或多个假设性提问;将子文本块、父文本块总结文本、父文本块假设性提问进行向量化,并存入向量数据库中;基于用户输入的查询问题文本,在向量数据库中进行查询并提取唯一标识,获取若干个父文本块;将若干个父文本块与用户提出的问题组成提示词,生成最终答案。本发明提升了语义检索的准确性和召回率。
技术关键词
文本
大语言模型
关系型数据库
标识
分片
答案
语义
可读存储介质
处理器
模块
计算机设备
指令
存储器
界面
系统为您推荐了相关专利信息
大数据管理方法
建筑施工技术
施工全过程
大数据智能算法
知识图谱模型
三维角色模型
场景联动方法
多用户交互
音频
VR设备