一种可预设KV缓存容量的大模型构建方法及装置

正文

推荐专利

申请号：CN202411445684

申请日期：2024-10-16

公开号：CN119377133B

公开日期：2025-07-08

类型：发明专利

摘要

本申请提供一种可预设KV缓存容量的大模型构建方法及装置，应用于大模型的Transformer结构中的注意力层，注意力层包括由M个键值向量构成的键值向量序列MV，以及由M个键向量构成的键向量序列MK；其中，M等于预设值；方法包括针对第N个输入向量，将其映射为写入查询向量wq及第一写入键值向量wv；利用写入查询向量wq与M个键向量进行计算，得到写入权重向量ww；利用写入权重向量ww及第一写入键值向量wv，对历史键值向量序列MV＇中的M个键值向量进行更新，将更新得到的键值向量序列MV写入缓存中。这样，可以实现可预设长度的KV缓存容量方案，以替代随上下文长度无限增长的KV缓存容量方案。

技术关键词

键值模型构建方法序列注意力矩阵模型构建装置文本输出模块

系统为您推荐了相关专利信息

一种跨区域电网碳排放分布式计算方法、系统及设备

主节点分布式计算方法因子矩阵迭代算法

融合背景知识与用户特征的虚假新闻实时检测方法与系统

语义特征帖子实时检测方法预训练语言模型融合特征

一种横波速度预测方法、装置、设备及可读存储介质

速度预测模型横波速度预测方法置换器结构特征提取测井

基于多源数据预测的铁路设施损伤评估方法

损伤评估方法指数损伤特征值序列铁路

基于Gabor滤波和亚像素的角膜地形图特征点提取方法及系统

角膜地形图特征点提取方法 Gabor滤波器像素图像特征点

一种可预设KV缓存容量的大模型构建方法及装置

站点导航

APP 下载