一种用于小型设备的基于细粒度调度的深度学习模型内存优化方法

AITNT
正文
推荐专利
一种用于小型设备的基于细粒度调度的深度学习模型内存优化方法
申请号:CN202411069656
申请日期:2024-08-06
公开号:CN118916167A
公开日期:2024-11-08
类型:发明专利
摘要
本发明一种用于嵌入式设备的基于细粒度调度的深度学习模型内存优化方法,属于深度学习模型领域。本发明输入深度学习模型DNN到分析器,分析器根据DNN中各个算子的TE分析该算子及其所依赖的算子的循环轴的连接关系,输出轴连接图ACG给优化器;优化器根据ACG搜索对DNN的切分方案,将DNN转换为细粒度的DNN,并对其进行调度;将细粒度DNN及其调度交给模拟器评估其内存占用,通过测量器获得其执行性能,将内存和性能数据反馈给优化器进行迭代搜索,以得到最优的细粒度DNN及其调度,据此生成DNN的执行代码,并编译部署在目标设备上。本发明在不超过5%的性能开销的前提下,能够显著优化众多流行深度神经网络DNN运行时的内存需求,拓宽了DNN在小型设备上的应用范围。
技术关键词
内存优化方法 深度学习模型 小型设备 优化器 模拟器 测量器 分析器 数据存储 深度神经网络 嵌入式设备 序列 关系 节点 索引 表达式 格式 因子 矩阵
系统为您推荐了相关专利信息
1
脑外科手术中神经电生理信号实时电子处理系统
脑外科手术 纳米级复合材料 频谱分析模块 电信号 光纤传输通道
2
一种基于电力波动调控模型的铝电解绿电调控方法及系统
调控模型 铝电解 深度学习模型 预测电解槽 调控系统
3
一种基于预训练语言模型的电网监控信息智能告警方法、系统、计算机设备及储存介质
智能告警方法 预训练语言模型 文本 门控循环单元 深度学习模型
4
一种高效肿瘤介入消融精准定位系统
精准定位系统 导航模块 可视化模块 深度学习模型 多模态影像数据
5
融合深度学习的GPON网络故障智能诊断与自愈系统
融合深度学习 自愈系统 数据采集层 长短期记忆网络 故障诊断模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号