摘要
本发明公开了一种基于参数量化的深度神经网络模型压缩方法及装置。所述方法通过对预训练模型利用训练集进行微调,利用重要性评估样本集合数据记录权重梯度绝对值,区分高、低重要性权重;迭代量化高重要性权重,重新训练低重要性权重并更新权重重要性,使用二值掩码标识重要性,直至量化完成;其中量化操作采用就近二次幂技术,映射权重至非均匀二次幂网格;最终保存量化后的深度神经网络模型。本发明通过精确的参数选择和量化策略,实现了模型体积的有效压缩,并确保了模型在边缘设备上的高效部署,为深度学习技术在资源受限环境中的应用提供了重要支持。
技术关键词
深度神经网络模型
量化误差
参数
训练集数据
资源受限环境
深度学习技术
网格
标识
处理器
样本
计算机设备
计算方法
可读存储介质
程序
模块
存储器
策略
系统为您推荐了相关专利信息
电机执行器
驱动单元
控制单元
微控制器单元
控制系统
曲面玻璃幕墙
数据采集方法
施工误差
三维激光扫描设备
三维模型
智慧海洋
数据共享特征
海洋灾害
联邦深度学习
智能诊断算法