基于大语言模型检索增强生成的方法、系统、设备及介质

正文

推荐专利

申请号：CN202411070464

申请日期：2024-08-06

公开号：CN118964387A

公开日期：2024-11-15

类型：发明专利

摘要

本发明公开了一种基于大语言模型检索增强生成的方法、系统、设备及介质，该方法包括：将文本文件分片，得到多个父文本块，并为每个父文本块生成唯一标识，将所有父文本块及其对应的唯一标识存入关系型数据库；将每个父文本块再次分片得到多个子文本块，对每个父文本块进行文本总结，得到多个父文本块总结文本；针对每个父文本块生成一个或多个假设性提问；将子文本块、父文本块总结文本、父文本块假设性提问进行向量化，并存入向量数据库中；基于用户输入的查询问题文本，在向量数据库中进行查询并提取唯一标识，获取若干个父文本块；将若干个父文本块与用户提出的问题组成提示词，生成最终答案。本发明提升了语义检索的准确性和召回率。

技术关键词

文本大语言模型关系型数据库标识分片答案语义可读存储介质处理器模块计算机设备指令存储器界面

系统为您推荐了相关专利信息

一种建筑施工技术质量管理大数据管理方法与系统

大数据管理方法建筑施工技术施工全过程大数据智能算法知识图谱模型

问答系统文本数据图片双模态

样本文本语句计算机执行指令三元组

指标项目评估方法开发利用价值政务数据安全

三维角色模型场景联动方法多用户交互音频 VR设备

基于大语言模型检索增强生成的方法、系统、设备及介质

站点导航

APP 下载