摘要
本发明公开了一种基于动态流水线的检索增强生成方法及系统,属于固态存储和大语言模型交叉领域,包括:通过预设的检索方法检索预先建立的文本语料库,以从中获取top‑k个与用户输入的查询内容最相似的文本作为检索结果,将检索结果放入结果集;检索方法包括多次迭代,每次迭代都会检索出与查询内容最相似的部分文本;在通过检索方法检索文本语料库的过程中,分多次从结果集中预取部分文本并放入预先建立在内存中的流水线池;分多次从流水线池中取文本并提供给大语言模型,以由大语言模型计算相应的键和值,并将计算结果填充至大语言模型的KV缓存,供大语言模型的解码阶段使用。本发明能够掩盖知识检索的延迟,以减少检索增强生成系统的响应时间。
技术关键词
文本
流水线
大语言模型
检索方法
生成方法
预取模块
生成系统
动态
因子
内存
解码
硬盘
阶段
频率
固态
数据
系统为您推荐了相关专利信息
切割路径规划方法
临时支撑结构
轮廓区域
切割机
启发式搜索算法
局部注意力机制
语言编码器
自然语言
融合注意力机制
阶段
数据生成方法
数据生成程序
校验程序
标签
程序生成模块
堆叠模块
语音识别方法
残差模块
局部空间特征
线性
冗余
障碍物
节点生成方法
机器人工作空间
生成机器人