摘要
本申请实施例提供了模型压缩方法、装置、设备、存储介质及程序产品。该方法包括:通过各网络层的最高修剪率和最低量化位宽确定各网络层的敏感类型,基于所述各网络层的所述敏感类型对应的候选修剪率的架构参数以及候选量化位宽的架构参数对应确定所述各网络层的各个候选修剪率被选中的概率以及各个候选量化位宽被选中的概率,并基于第一训练集和验证集,结合所述最高修剪率以及最低量化位宽对应更新各个候选修剪率被选中的概率以及各个候选量化位宽被选中的概率的方式,可以实现自动为深度神经网络各网络层寻找合适的压缩策略,实现更高的压缩效率与精度平衡。
技术关键词
深度神经网络
模型压缩方法
训练集
计算机可执行指令
基础
参数
精度
处理器
计算机程序产品
电子设备
存储装置
模块
策略
系统为您推荐了相关专利信息
语音生成模型
音频解码器
非易失性计算机可读存储介质
视频帧编码器
音频编码器
结构特征提取
成像
卷积神经网络模型
深度图
全局平均池化
冰排
识别预警方法
数字孪生
计算机视觉识别
分级预警系统
充电负荷模型
曲线
记录媒体
分布式供电技术
小区