模型推理方法、装置、系统、存储介质及程序产品

AITNT
正文
推荐专利
模型推理方法、装置、系统、存储介质及程序产品
申请号:CN202410865956
申请日期:2024-06-28
公开号:CN118886500A
公开日期:2024-11-01
类型:发明专利
摘要
本公开提供了一种模型推理方法、装置、系统、存储介质及程序产品。所述模型推理方法包括:在使用目标模型进行推理的过程中,响应于执行所述目标模型推理的系统的空闲物理显存不足,将至少一个指定矩阵的部分矩阵分块,移出所述系统的物理显存;在推理计算所需要的目标矩阵分块未保存在所述物理显存的情况下,从所述系统的虚拟显存中加载所述目标矩阵分块到所述物理显存;其中,每个指定矩阵包括多个矩阵分块;其中,所述目标矩阵分块为所述指定矩阵的矩阵分块;其中,所述虚拟显存由所述系统的内存实现,并用于保存和更新所述指定矩阵。
技术关键词
推理方法 矩阵 分块 物理 计算机可执行指令 推理装置 计算机程序产品 加载单元 内存 存储装置 可读存储介质 总量 数据 处理器
系统为您推荐了相关专利信息
1
平台固件升级校验方法及基于带外管理的集群管理系统
固件更新 升级校验方法 集群管理系统 更新固件 管理终端
2
一种图像显示方法及电子设备
前轮转向角度 卡尔曼滤波模型 加速度 图像显示方法 协方差矩阵
3
一种用于停车厅的智能化停车方法及相关设备
停车方法 矩阵 深度强化学习算法 车辆底部 智慧停车技术
4
基于双通道语义增强和卷积神经网络的文本分类方法
文本分类方法 语义 注意力 卷积特征提取 矩阵
5
一种目标检测方法、装置、设备及存储介质
多普勒 脉冲超宽带 矩阵 信道脉冲响应 回波
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号