一种基于推理实例快照的推理平台

正文

推荐专利

一种基于推理实例快照的推理平台

申请号：CN202510396607

申请日期：2025-04-01

公开号：CN120448027A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了AI推理平台技术领域的一种基于推理实例快照的推理平台，由网关、调度器、节点代理、推理容器实例、容器运行时以及快照对象存储组成的系统；S1，将已初始化完成的推理容器的CPU和GPU状态保存为可迅速恢复的文件；S2，通过将GPU状态存储在内存或高速对象存储中，在将GPU状态导入显存时，获得超过操作系统文件系统带宽的性能，该基于推理实例快照的推理平台，结构设计合理，推理实例在待机状态下不占用GPU和CPU计算资源，推理实例能够低延迟启动，InferX推理平台在以下场景下可有效提升GPU资源利用率，当推理实例发生故障时，系统可快速重启新实例，以保证服务连续性；可基于实时负载动态扩展新实例，以满足突发请求需求，同时避免GPU资源闲置。

技术关键词

推理平台快照容器内存节点对象文件系统虚拟机操作系统 RDMA网卡调度器操作系统进程网络安全隔离镜像高速通信网络待机资源可充分发挥数据

系统为您推荐了相关专利信息

面向无人机组网的宽窄带链路辅助路由方法

链路邻居面向无人机多节点协作无人机自组织网络

多功能仿生机器人智能任务规划和控制方法及系统

仿生机器人注意力事件流节点控制器

一种基于分布式卸载算法的车机计算资源分配系统

卸载算法资源分配系统车辆模型训练模块组网模块

粗细粒度结合的三维建筑模型组织方法、装置、电子设备及存储介质

三维建筑模型数据组织结构建筑物模型孩子组织模块

一种提高电器有用能量转化率的装置及节电控制算法

曲线数据分析模型电压波形电流

一种基于推理实例快照的推理平台

站点导航

APP 下载