针对深度学习模型的内存分配方法、计算机设备及介质

AITNT
正文
推荐专利
针对深度学习模型的内存分配方法、计算机设备及介质
申请号:CN202510346473
申请日期:2025-03-21
公开号:CN120276844A
公开日期:2025-07-08
类型:发明专利
摘要
本申请提供一种针对深度学习模型的内存分配方法、计算机设备及介质。方法包括:获取目标深度学习模型中的模型参数量以及输入尺寸;获取所述目标深度学习模型的预期最大批处理量;基于所述模型参数量、所述输入尺寸以及所述预期最大批处理量,确定所述目标深度学习模型的预期内存容量;按照所述预期内存容量,为所述目标深度学习模型分配显卡内存。本申请通过基于目标深度学习模型中的模型参数量以及输入尺寸、预期内存容量,确定目标深度学习模型的预期内存容量,使得目标深度学习模型的显卡内存分配更加合理,以减少内存溢出或者模型推理速度下降的情况。
技术关键词
深度学习模型 内存分配方法 显卡 多层网络结构 矩阵乘法运算 两层网络结构 计算机设备 参数 可读存储介质 尺寸 存储器 处理器 阶段 主机 数据
系统为您推荐了相关专利信息
1
一种基于动态规划的供应链物流智能调度方法
物流智能调度 数据同步周期 仓库 深度学习模型 因子
2
一种断路器触头磨损程度智能评估系统
智能评估系统 断路器触头 健康监测模块 数据显示模块 信号处理模块
3
用于白内障的图像识别方法及系统
融合图像特征 图像识别方法 深度学习模型训练 眼睛 影像
4
基于语义依存分析的车辆控制方法、装置、介质及产品
语义依存分析 车辆控制方法 意图指令 语义结构 数值
5
基于双流深度学习的IMCC术前分级预测方法、装置及设备
分级预测方法 影像 深度学习模型 分支 数据中心
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号