摘要
本发明提供了一种神经网络算子内存分配方法及系统、电子设备和存储介质,涉及深度学习的技术领域。算子内存分配方法包括:根据目标算子的目标占用内存,基于计算顺序依次对目标算子在目标芯片的第一存储器中进行内存分配;在第一存储器的剩余存储空间满足第一预设条件的情况下,将当前待内存分配的目标算子在所述第一存储器中执行内存分配;将第一存储器的当前存储数据传输至目标芯片的第二存储器中,以在空闲状态的第一存储器中根据计算顺序继续遍历剩余目标算子的内存分配,直至所有的目标算子内存分配完毕。本发明可以结合优化后内存分配实现算子的拆分和算子内存分配,可以提高神经网络的模型推理速度。
技术关键词
内存分配方法
内存分配系统
存储器
分配单元
网络图结构
非易失性计算机可读存储介质
芯片
遍历算法
神经网络模型
信息处理单元
电子设备
处理器
分区
存储装置
程序
数据
速度