摘要
本公开提供了一种模型推理方法、装置、系统、存储介质及程序产品。所述模型推理方法包括:在使用目标模型进行推理的过程中,响应于执行所述目标模型推理的系统的空闲物理显存不足,将至少一个指定矩阵的部分矩阵分块,移出所述系统的物理显存;在推理计算所需要的目标矩阵分块未保存在所述物理显存的情况下,从所述系统的虚拟显存中加载所述目标矩阵分块到所述物理显存;其中,每个指定矩阵包括多个矩阵分块;其中,所述目标矩阵分块为所述指定矩阵的矩阵分块;其中,所述虚拟显存由所述系统的内存实现,并用于保存和更新所述指定矩阵。
技术关键词
推理方法
矩阵
分块
物理
计算机可执行指令
推理装置
计算机程序产品
加载单元
内存
存储装置
可读存储介质
总量
数据
处理器
系统为您推荐了相关专利信息
固件更新
升级校验方法
集群管理系统
更新固件
管理终端
前轮转向角度
卡尔曼滤波模型
加速度
图像显示方法
协方差矩阵
停车方法
矩阵
深度强化学习算法
车辆底部
智慧停车技术