一种基于动态流水线的检索增强生成方法及系统

正文

推荐专利

申请号：CN202411939259

申请日期：2024-12-26

公开号：CN119848202B

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于动态流水线的检索增强生成方法及系统，属于固态存储和大语言模型交叉领域，包括：通过预设的检索方法检索预先建立的文本语料库，以从中获取top‑k个与用户输入的查询内容最相似的文本作为检索结果，将检索结果放入结果集；检索方法包括多次迭代，每次迭代都会检索出与查询内容最相似的部分文本；在通过检索方法检索文本语料库的过程中，分多次从结果集中预取部分文本并放入预先建立在内存中的流水线池；分多次从流水线池中取文本并提供给大语言模型，以由大语言模型计算相应的键和值，并将计算结果填充至大语言模型的KV缓存，供大语言模型的解码阶段使用。本发明能够掩盖知识检索的延迟，以减少检索增强生成系统的响应时间。

技术关键词

文本流水线大语言模型检索方法生成方法预取模块生成系统动态因子内存解码硬盘阶段频率固态数据

系统为您推荐了相关专利信息

一种切割路径规划方法、控制装置和切割机

切割路径规划方法临时支撑结构轮廓区域切割机启发式搜索算法

基于改进Llama模型的自然语言处理方法

局部注意力机制语言编码器自然语言融合注意力机制阶段

ADaM数据生成方法、装置、设备及存储介质

数据生成方法数据生成程序校验程序标签程序生成模块

一种基于大核卷积和线性自注意力的语音识别方法

堆叠模块语音识别方法残差模块局部空间特征线性

基于位置及障碍约束的机器人冗余姿态规划方法及系统

冗余障碍物节点生成方法机器人工作空间生成机器人

一种基于动态流水线的检索增强生成方法及系统

站点导航

APP 下载