一种面向神经网络模型部署的内存管理方法、装置及介质

正文

推荐专利

申请号：CN202510286472

申请日期：2025-03-11

公开号：CN120315857A

公开日期：2025-07-15

类型：发明专利

摘要

本发明实施例公开了一种面向神经网络模型部署的内存管理方法、装置及介质；方法包括：按照需求对已训练的、待部署的深度学习模型进行解析，得到计算图；按照模式将其拆分为若干计算子图；选取内存管理策略，得到子图内存调度方案；对其进行整合，得到整体内存调度方案。实施本发明实施例所提供的内存管理方案，通过对计算图进行切分，划分为多个计算子图，通过对计算子图使用不同的内存管理策略得到局部最优的内存管理方案，增加了内存调度的搜索空间，进而得到比使用单一策略更优的、全局内存管理方案，减少了深度学习内存占用量，提高了芯片内存资源的利用率，使得用户可以在不改变芯片配置的前提下，部署更加复杂的深度学习模型。

技术关键词

面向神经网络模型内存管理方法管理策略深度学习模型内存管理装置节点输入设备内存占用量处理器可读存储介质存储计算机程序解析单元存储器指令数据模式芯片

系统为您推荐了相关专利信息

一种形变文档图像精准拟合弯曲边界的方法及装置

弯曲边界深度学习模型边界轮廓曲线拟合技术控制点

用于特种设备安全检测的图像智能分析系统及方法

特种设备三维卷积神经网络裂纹扩展路径生成点云数据激光扫描设备

一种商拍场景中的实体分割方法、装置、设备及存储介质

服饰掩膜重叠阈值深度学习模型分割方法

一种基于多视图掩码自编码器的点云自监督分类方法及系统

监督分类方法编码器三维点云数据分类系统信息数据处理终端

一种无人机特高压变电站巡检路径规划方法及系统

特高压变电站巡检路径规划方法无人机路径规划无人机巡检路径粒子群算法

一种面向神经网络模型部署的内存管理方法、装置及介质

站点导航

APP 下载