一种用于小型设备的基于细粒度调度的深度学习模型内存优化方法

正文

推荐专利

申请号：CN202411069656

申请日期：2024-08-06

公开号：CN118916167A

公开日期：2024-11-08

类型：发明专利

摘要

本发明一种用于嵌入式设备的基于细粒度调度的深度学习模型内存优化方法，属于深度学习模型领域。本发明输入深度学习模型DNN到分析器，分析器根据DNN中各个算子的TE分析该算子及其所依赖的算子的循环轴的连接关系，输出轴连接图ACG给优化器；优化器根据ACG搜索对DNN的切分方案，将DNN转换为细粒度的DNN，并对其进行调度；将细粒度DNN及其调度交给模拟器评估其内存占用，通过测量器获得其执行性能，将内存和性能数据反馈给优化器进行迭代搜索，以得到最优的细粒度DNN及其调度，据此生成DNN的执行代码，并编译部署在目标设备上。本发明在不超过5％的性能开销的前提下，能够显著优化众多流行深度神经网络DNN运行时的内存需求，拓宽了DNN在小型设备上的应用范围。

技术关键词

内存优化方法深度学习模型小型设备优化器模拟器测量器分析器数据存储深度神经网络嵌入式设备序列关系节点索引表达式格式因子矩阵

系统为您推荐了相关专利信息

脑外科手术中神经电生理信号实时电子处理系统

脑外科手术纳米级复合材料频谱分析模块电信号光纤传输通道

一种基于电力波动调控模型的铝电解绿电调控方法及系统

调控模型铝电解深度学习模型预测电解槽调控系统

一种基于预训练语言模型的电网监控信息智能告警方法、系统、计算机设备及储存介质

智能告警方法预训练语言模型文本门控循环单元深度学习模型

一种高效肿瘤介入消融精准定位系统

精准定位系统导航模块可视化模块深度学习模型多模态影像数据

融合深度学习的GPON网络故障智能诊断与自愈系统

融合深度学习自愈系统数据采集层长短期记忆网络故障诊断模块

一种用于小型设备的基于细粒度调度的深度学习模型内存优化方法

站点导航

APP 下载