摘要
本申请公开了一种多层卷积算子融合优化方法、装置、设备、介质及产品,涉及编译优化技术领域,该方法包括:确定待部署模型的原始计算图,基于硬件性能模型,确定原始计算图中的多个可融合算子子图;基于可融合算子子图优化原始计算图,得到优化计算图;基于优化计算图和分片尺寸,得到待部署模型的并行优化代码;目标机器运行并行优化代码,得到待部署模型的优化性能;本申请通过基于可融合算子子图优化原始计算图,能够提高目标机器执行神经网络模型时的性能。
技术关键词
融合优化方法
优化装置
节点
编译优化技术
卷积神经网络模型
分片
卷积滤波器
冗余
处理器
关系
计算机程序产品
尺寸
模块
计算机设备
可读存储介质
存储器
数据
策略
系统为您推荐了相关专利信息
火灾检测方法
火灾检测系统
滑动时间窗口
数据采集模块
通信节点
性能预测方法
DLC涂层
性能预测模型
实验室管理系统
机器学习模型
高寒山区
径流
遥感技术
时间序列遥感数据
分析方法
DCS系统
条件生成对抗网络
场景特征
数字孪生模型
智能运维平台