键值缓存数据的调度方法、大模型推理方法及装置

正文

推荐专利

申请号：CN202510219153

申请日期：2025-02-26

公开号：CN120276667B

公开日期：2025-12-05

类型：发明专利

摘要

本申请提供一种键值缓存数据的调度方法、大模型推理方法及装置，涉及人工智能技术领域。该方法包括：利用预测模型预测大模型推理后续token所需的目标键值缓存数据；后续token是指大模型还未推理的token；判断是否需要对所述目标键值缓存数据进行调度；若需要调度，则生成调度策略；根据调度策略从第一存储空间获取目标键值缓存数据，并将目标键值缓存数据存储至第二存储空间；其中，目标键值缓存数据用于使大模型推理后续token。本申请减少对第一存储空间的频繁访问，并且，每次只传输需要的目标键值缓存数据，而非全量的键值缓存数据，减少了因传输键值缓存数据导致的带宽资源的占用。

技术关键词

键值推理方法计算机程序指令策略强化学习算法推理装置图形处理器异步方式人工智能技术计算机程序产品调度装置中央处理器模块存储器高带宽

系统为您推荐了相关专利信息

一种模拟神经发育障碍的小鼠模型

神经发育障碍小鼠模型生物模型技术复合物神经系统

多模态结直肠癌预诊信息处理方法、系统、介质以及设备

模态特征语义关键词局部特征信息词嵌入向量算法模型

一种基于物理映射建模和TD3算法的FMCW激光测量系统光源非线性校正方法

非线性校正方法网络三角波物理频率

用于车载系统的数据持久化存储方法、装置及存储介质

键值车载系统虚拟化系统分区 Android系统

一种气浮平台目标追踪控制方法

气浮平台运动模拟器姿态角速度飞轮追踪控制方法

键值缓存数据的调度方法、大模型推理方法及装置

站点导航

APP 下载