一种基于多级缓存的模型调度方法、装置、设备及介质

正文

推荐专利

申请号：CN202510482562

申请日期：2025-04-17

公开号：CN120353553A

公开日期：2025-07-22

类型：发明专利

摘要

本申请公开了一种基于多级缓存的模型调度方法、装置、设备及介质，涉及人工智能领域，包括：在模型部署的过程中，基于获取的模型访问请求对预设缓存架构中对应的待推理模型的当前模型热度进行更新；其中，预设缓存架构由上至下的缓存层分别为显存缓存层、进程内存缓存层、共享内存缓存层以及持久化缓存层；确定待推理模型在预设缓存架构中的目标缓存层，并当目标缓存层为显存缓存层时，触发对待推理模型的预设推理操作；当目标缓存层为非显存缓存层时，基于位于目标缓存层之上的其他缓存层中的各当前模型热度将待推理模型调度至显存缓存层，以在显存缓存层触发对待推理模型的预设推理操作。因此，本申请能够实现模型资源的高效利用和智能管理。

技术关键词

模型调度方法内存进程数据调度装置时间段深度学习框架指数字节流机制可读存储介质模块因子处理器周期电子设备存储器计算机资源

系统为您推荐了相关专利信息

一种基于深度融合网络的单工况刀具磨损预测方法

深度融合网络刀具磨损预测方法预测网络模型时序卷积神经网络数据

基于LLM的商品信息匹配系统、方法、设备和存储介质

商品信息匹配信息处理模块电商销售平台信息采集单元库存管理

寄存器阵列及其配置方法、装置、电子设备、可读介质

时钟门控单元关系芯片阵列控制器

洗脸巾无人工厂生产系统

洗脸巾传感采集模块数据处理单元闭环反馈控制气味特征

基于LLM的跨系统异构元数据智能采集方法及系统

数据智能采集方法节点异构信息系统大语言模型注意力

一种基于多级缓存的模型调度方法、装置、设备及介质

站点导航

APP 下载