一种键值缓存剪枝方法及系统

AITNT
正文
推荐专利
一种键值缓存剪枝方法及系统
申请号:CN202510794368
申请日期:2025-06-13
公开号:CN120910092A
公开日期:2025-11-07
类型:发明专利
摘要
本发明提供一种键值缓存剪枝方法及系统,首先获取大语言模型的查询向量、待剪枝的键缓存向量集合和待剪枝的值缓存向量集合;根据查询向量和待剪枝的键缓存向量集合,计算键缓存向量重要性评估值;根据待剪枝的值缓存向量集合,计算值缓存向量重要性评估值;根据键缓存向量重要性评估值和值缓存向量重要性评估值,确定键值缓存重要性度量结果;基于键值缓存重要性度量结果对待剪枝的键缓存向量集合和待剪枝的值缓存向量集合进行键值缓存剪枝,以保留具有大激活值的键缓存向量和具有大激活值的值缓存向量。本发明的方法不仅减少了键值缓存的存储需求,而且保持了优越的模型性能。
技术关键词
剪枝方法 键值 注意力 大语言模型 度量 非暂态计算机可读存储介质 Softmax函数 处理器 计算机程序产品 平方根 模块 阶段 存储器 电子设备 语句 解码
系统为您推荐了相关专利信息
1
一种基于混合Transformer的驾驶员视线映射方法
注意力 全局平均池化 眼睛特征 特征提取器 驾驶员人脸
2
用于校准ABG滤波器以改善电动机的位置信号的方法
机器学习算法 计算机 滤波器 加速度 因子
3
车辆控制方法、装置、电子设备、车辆以及存储介质
车辆控制方法 大语言模型 计算机程序指令 车辆座舱 标识
4
用电安全三维动画实操型培训系统
场景 培训系统 视频 模块 三维模型
5
演示文稿的生成方法、装置、存储介质以及电子设备
模板 大语言模型 文本 层级 生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号