摘要
本申请实施例提供一种模型推理方法、计算机程序产品及芯片。在模型推理过程中,可以存储每个词元在每一层的隐藏状态,在需要用到这些词元的键值缓存时,可以基于该隐藏状态和键值投影权重矩阵恢复每个词元在模型每一层的键值缓存。本申请实施例提供的键值缓存恢复方案,可以同时以较低的开销利用芯片的计算资源和数据传输带宽资源,而不是单一的使用一种资源实现键值缓存的恢复,可以大大提高键值缓存的恢复效率,进而,提高模型的推理效率。
技术关键词
键值
存储单元
策略
计算机程序产品
位置编码信息
推理方法
芯片
内存访问技术
文本
索引表
序列
矩阵恢复
数据
可读存储介质
处理器
存储器
标识
系统为您推荐了相关专利信息
巡检机器人
巡检项目
设备巡检方法
非易失性存储介质
检测仪器
变量
随机森林模型
计算机可读指令
建模误差
编码器
监控指标数据
调优方法
结构方程模型
计算机执行指令
参数
入侵检测方法
归一化方法
集成策略
彩色图像
车载CAN网络