模型中键值缓存的容错方法、产品、设备及介质

正文

推荐专利

申请号：CN202510998851

申请日期：2025-07-18

公开号：CN120508433B

公开日期：2025-09-19

类型：发明专利

摘要

本申请公开了一种模型中键值缓存的容错方法、产品、设备及介质，涉及计算机技术领域，包括逐层读取多个注意力层中每一层的键值缓存中多个词元的键向量并进行检测，在检测到当前层对应的第一词元的键向量存在读取错误的情况下，根据第一词元在上一层的注意力重要性，修正当前层的注意力分数，解决了键值缓存中的键向量读取错误导致的模型推理的稳定性差且可靠性差的技术问题，达到了提高键值缓存的容错能力，从而提高模型推理的稳定性和可靠性的技术效果。

技术关键词

容错方法键值预训练语言模型多层注意力重构矩阵文本存储计算机程序计算机程序产品模块备份处理器电子设备介质存储器数据

模型中键值缓存的容错方法、产品、设备及介质

站点导航

APP 下载