一种基于参数量化的深度神经网络模型压缩方法及装置

正文

推荐专利

申请号：CN202411957282

申请日期：2024-12-30

公开号：CN119904729A

公开日期：2025-04-29

类型：发明专利

摘要

本发明公开了一种基于参数量化的深度神经网络模型压缩方法及装置。所述方法通过对预训练模型利用训练集进行微调，利用重要性评估样本集合数据记录权重梯度绝对值，区分高、低重要性权重；迭代量化高重要性权重，重新训练低重要性权重并更新权重重要性，使用二值掩码标识重要性，直至量化完成；其中量化操作采用就近二次幂技术，映射权重至非均匀二次幂网格；最终保存量化后的深度神经网络模型。本发明通过精确的参数选择和量化策略，实现了模型体积的有效压缩，并确保了模型在边缘设备上的高效部署，为深度学习技术在资源受限环境中的应用提供了重要支持。

技术关键词

深度神经网络模型量化误差参数训练集数据资源受限环境深度学习技术网格标识处理器样本计算机设备计算方法可读存储介质程序模块存储器策略

系统为您推荐了相关专利信息

一种电机执行器的控制系统、方法及产品

电机执行器驱动单元控制单元微控制器单元控制系统

一种训练扩散模型以及图像质量恢复的方法

噪声图像样本噪声预测编码器编解码

一种异形曲面玻璃幕墙安装逆向建模数据采集方法

曲面玻璃幕墙数据采集方法施工误差三维激光扫描设备三维模型

一种基于人工智能联邦学习的智慧海洋数据安全共享与分级灾害预警系统

智慧海洋数据共享特征海洋灾害联邦深度学习智能诊断算法

一种利用氮气作为喷涂介质的保险杠喷涂方法

保险杠喷涂方法氮气喷涂机器人介质管路

一种基于参数量化的深度神经网络模型压缩方法及装置

站点导航

APP 下载