KV缓存的管理方法、调度器、介质、设备及产品

AITNT
正文
推荐专利
KV缓存的管理方法、调度器、介质、设备及产品
申请号:CN202411921617
申请日期:2024-12-24
公开号:CN119645660B
公开日期:2025-10-17
类型:发明专利
摘要
本公开涉及一种KV缓存的管理方法、调度器、介质、设备及产品,所述方法包括:若监测到主节点在执行推理任务的过程中,存在满足迁移条件的推理序列,则从N个从节点中确定目标从节点;分别向各个主节点下发迁移指令,迁移指令用于指示主节点将第一KV缓存发送至目标从节点,第一KV缓存为主节点生成的第二数量个连续的token对应的KV缓存;向目标从节点下发接收指令,接收指令用于指示目标从节点接收并存储各个主节点分别发送的第一KV缓存。通过上述技术方案,采用主节点和从节点异构的配置方式,可以降低推理系统的总成本,将主节点生成的KV缓存迁移至从节点中,避免主节点在进行长序列推理时KV缓存的爆炸问题。
技术关键词
主节点 存储单元 推理系统 调度器 指令 并行策略 管理方法 序列 计算机程序产品 流水线 调度算法 处理器 可读存储介质 存储器 电子设备 模块 异构 内存
系统为您推荐了相关专利信息
1
一种迭代增强的动态扩展持续学习模型
蒸馏 持续学习方法 矩阵 样本 预训练模型
2
IVIM和DKI联合模型多b值扩散加权的MRI图像处理方法
图像处理方法 磁共振图像处理 扩散加权成像 人体组织器官 序列
3
数据存储管理方法、装置、设备以及存储介质
数据存储管理方法 标识符 校验算法 数据存储管理设备 数据存储管理装置
4
多方联邦学习方法、系统、设备、存储介质及程序产品
联邦学习方法 节点 零知识证明 联邦学习模型 联邦学习系统
5
一种基于智慧物联的配电线路线温诊断方法及系统
诊断系统 诊断方法 长短期记忆网络 数据处理模块 数据管理模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号