模型压缩方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202511117591

申请日期：2025-08-11

公开号：CN120952085A

公开日期：2025-11-14

类型：发明专利

摘要

本申请实施例提供了模型压缩方法、装置、设备、存储介质及程序产品。该方法包括：通过各网络层的最高修剪率和最低量化位宽确定各网络层的敏感类型，基于所述各网络层的所述敏感类型对应的候选修剪率的架构参数以及候选量化位宽的架构参数对应确定所述各网络层的各个候选修剪率被选中的概率以及各个候选量化位宽被选中的概率，并基于第一训练集和验证集，结合所述最高修剪率以及最低量化位宽对应更新各个候选修剪率被选中的概率以及各个候选量化位宽被选中的概率的方式，可以实现自动为深度神经网络各网络层寻找合适的压缩策略，实现更高的压缩效率与精度平衡。

技术关键词

深度神经网络模型压缩方法训练集计算机可执行指令基础参数精度处理器计算机程序产品电子设备存储装置模块策略

系统为您推荐了相关专利信息

视频语音生成模型的训练方法、视频合成方法及相关设备

语音生成模型音频解码器非易失性计算机可读存储介质视频帧编码器音频编码器

一种基于深度图卷积神经网络的成像质量评估方法

结构特征提取成像卷积神经网络模型深度图全局平均池化

基于数字孪生的寒地桥梁建设过程冰排冲击识别预警方法及系统

冰排识别预警方法数字孪生计算机视觉识别分级预警系统

一种告警信息处理方法、装置、设备及介质

视频流联网设备时间段主机视频智能分析模块

一种住宅小区充电负荷模型的构造方法、记录媒体和系统

充电负荷模型曲线记录媒体分布式供电技术小区

模型压缩方法、装置、设备、存储介质及程序产品

站点导航

APP 下载