摘要
本发明提供一种基于存算一体架构的神经网络模型压缩方法及系统,其方法包括:对神经网络模型每个卷积层,确定该卷积层输出通道的重要性评分;根据重要性评分确定剪枝阈值,并执行剪枝操作,修剪重要性评分低于剪枝阈值的输出通道,基于被修剪的输出通道相应修剪下一卷积层的输入通道;基于每个被修剪的卷积层,得到修剪后的神经网络模型;修剪后的神经网络模型用于调整交叉阵列结构。本发明通过确定卷积层输出通道的重要性评分,并据此设定剪枝阈值,精准修剪不重要的输出通道,同时相应修剪下一卷积层的输入通道,避免盲目剪枝对神经网络模型性能的影响,有效减少模型的冗余参数,降低神经网络模型的复杂度,使神经网络模型更加紧凑高效。
技术关键词
神经网络模型
交叉阵列结构
奇异值分解技术
修剪神经网络
压缩系统
通道
神经网络修剪
因子
通信接口
加速器
处理器
可读存储介质
矩阵
存储器
计算机程序产品
模块
复杂度
电子设备