摘要
提供了一种键值(KV)存储方法和用于键值存储的主机装置。所述方法包括:针对大语言模型LLM的每一轮词元生成,根据与当前轮词元生成相应的第一KV缓存策略将当前轮词元生成过程中使用的多个KV向量中的第一部分KV向量存储到外部存储装置,并将所述多个KV向量中的第二部分KV向量存储在主机装置中;以及基于确定当前轮词元生成被完成,在下一轮词元生成中,将所述多个KV向量中的第一部分KV向量从所述外部存储装置加载到主机装置中以用于所述下一轮词元生成。
技术关键词
外部存储装置
缓存策略
解码器
键值KV存储方法
主机装置执行
大语言模型
键值存储方法
图形处理单元
处理器
存储器模块
指令
可读存储介质
链路
计算机
系统为您推荐了相关专利信息
视频编码器
译码
机器学习模型
视频解码器
图像编码
脉冲重复间隔
雷达工作模式
循环神经网络模型
重构
编码器