摘要
本申请涉及神经网络模型部署技术领域,公开了一种神经网络模型部署方法、装置、设备、存储介质及计算机程序产品,该方法包括:获取待部署神经网络模型,并对待部署神经网络模型进行结构分析,确定待部署神经网络模型中的待压缩层;确定待压缩层的权重矩阵,并对权重矩阵进行奇异值分解,获得近似矩阵;根据近似矩阵对待部署神经网络模型进行压缩;对压缩后的待部署神经网络模型进行量化处理,并将量化处理后的待部署神经网络模型部署至目标边缘设备。本申请通过对待部署模型进行结构分析,确定待压缩层并通过对待压缩层对应的权重矩阵进行奇异值分解来对模型进行压缩,并对压缩后的模型量化,使模型可以部署在存储和计算能力受限的目标边缘设备。
技术关键词
神经网络模型
矩阵
计算机程序产品
正则化参数
模型压缩
处理器
可读存储介质
模块
变量
存储器
样本
数据
受限
因子
算法