摘要
本申请提供一种针对深度学习模型的内存分配方法、计算机设备及介质。方法包括:获取目标深度学习模型中的模型参数量以及输入尺寸;获取所述目标深度学习模型的预期最大批处理量;基于所述模型参数量、所述输入尺寸以及所述预期最大批处理量,确定所述目标深度学习模型的预期内存容量;按照所述预期内存容量,为所述目标深度学习模型分配显卡内存。本申请通过基于目标深度学习模型中的模型参数量以及输入尺寸、预期内存容量,确定目标深度学习模型的预期内存容量,使得目标深度学习模型的显卡内存分配更加合理,以减少内存溢出或者模型推理速度下降的情况。
技术关键词
深度学习模型
内存分配方法
显卡
多层网络结构
矩阵乘法运算
两层网络结构
计算机设备
参数
可读存储介质
尺寸
存储器
处理器
阶段
主机
数据
系统为您推荐了相关专利信息
物流智能调度
数据同步周期
仓库
深度学习模型
因子
智能评估系统
断路器触头
健康监测模块
数据显示模块
信号处理模块
融合图像特征
图像识别方法
深度学习模型训练
眼睛
影像
语义依存分析
车辆控制方法
意图指令
语义结构
数值