摘要
本申请实施例提供了一种模型优化方法、装置、电子设备及存储介质,涉及机器学习技术领域。方法包括:获取优化前的深度学习模型包含的每一算子的算子规格;基于获取到的算子规格,从优化前的深度学习模型包含的各算子中,确定待部署模型的硬件平台中神经处理单元不支持的算子,作为超规格算子;按照每一超规格算子的算子规格,生成该超规格算子对应的优化算子;一个超规格算子对应的优化算子包含神经处理单元支持的公开算子以及扩展算子;将每一超规格算子替换为对应的优化算子,得到优化后的深度学习模型;硬件平台中中央处理器用于运行优化后的深度学习模型中的扩展算子。如此,能够保证深度学习模型在硬件平台上的正常运行。
技术关键词
神经处理单元
深度学习模型
硬件平台
模型优化方法
子模块
中央处理器
逻辑
通道
参数
机器学习技术
数据接收模块
电子设备
可读存储介质
数据处理模块
优化装置
存储器
计算机
系统为您推荐了相关专利信息
深度学习特征
深度学习模型
肿瘤
特征提取技术
预后预测方法
无人机定位方法
激光点云数据
异构传感器
激光雷达点云数据
融合深度学习模型
大语言模型
自动生成系统
工作流引擎
自动生成方法
视觉
划线检测方法
频域特征
像素点
激光
深度学习模型
图像分类模型
铸态铝合金
图像分类方法
深度卷积网络
组织