模型中键值缓存管理系统、方法、设备及介质

AITNT
正文
推荐专利
模型中键值缓存管理系统、方法、设备及介质
申请号:CN202511073108
申请日期:2025-07-31
公开号:CN120578608B
公开日期:2025-09-26
类型:发明专利
摘要
本申请公开了一种模型中键值缓存管理系统、方法、设备及介质,涉及计算机技术领域,包括对输入文本的共享前缀部分和非共享部分进行识别,计算非共享部分的键值缓存数据,将非共享部分的键值缓存数据所需的存储空间大小输入至亲和性估计模型,得到将非共享部分的键值缓存数据存储至各内存节点的亲和性估计值,并根据亲和性估计值确定内存分配策略,以根据内存分配策略对非共享部分的键值缓存数据进行存储,解决了键值缓存数据占用大量内存,影响模型推理的服务性能的问题,达到了增加内存容量,满足模型推理的内存需求,提高模型推理的服务性能,且提高负载均衡的技术效果。
技术关键词
缓存管理系统 内存 键值 节点 缓存管理方法 策略 层级 训练语言模型 分层 文本 模块 字符 存储计算机程序 序列 框架 处理器 电子设备 介质 存储器
系统为您推荐了相关专利信息
1
一种河流流域水污染溯源方法、设备及介质
水污染溯源方法 水质模型 特征聚类分析 随机森林 污染物浓度分布图
2
一种基于语法树的结构化遥感报告生成系统、方法、设备及介质
报告生成系统 报告生成方法 非暂态计算机可读存储介质 数据一致性校验 参数
3
一种基于自有价格源的智能派单引擎系统
智能派单 引擎系统 订单 成人 键值存储系统
4
基于改进海洋捕食者算法的低碳冷链物流路径优化方法
物流路径优化方法 配送路径优化 节点 客户 规划
5
基于模块车联动作业的钢桁梁平面转体施工工艺
移动钢桁梁 顶升功能 三维激光扫描仪 同步控制系统 北斗导航系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号