一种基于参数量化的深度神经网络模型压缩方法及装置

AITNT
正文
推荐专利
一种基于参数量化的深度神经网络模型压缩方法及装置
申请号:CN202411957282
申请日期:2024-12-30
公开号:CN119904729A
公开日期:2025-04-29
类型:发明专利
摘要
本发明公开了一种基于参数量化的深度神经网络模型压缩方法及装置。所述方法通过对预训练模型利用训练集进行微调,利用重要性评估样本集合数据记录权重梯度绝对值,区分高、低重要性权重;迭代量化高重要性权重,重新训练低重要性权重并更新权重重要性,使用二值掩码标识重要性,直至量化完成;其中量化操作采用就近二次幂技术,映射权重至非均匀二次幂网格;最终保存量化后的深度神经网络模型。本发明通过精确的参数选择和量化策略,实现了模型体积的有效压缩,并确保了模型在边缘设备上的高效部署,为深度学习技术在资源受限环境中的应用提供了重要支持。
技术关键词
深度神经网络模型 量化误差 参数 训练集数据 资源受限环境 深度学习技术 网格 标识 处理器 样本 计算机设备 计算方法 可读存储介质 程序 模块 存储器 策略
系统为您推荐了相关专利信息
1
一种电机执行器的控制系统、方法及产品
电机执行器 驱动单元 控制单元 微控制器单元 控制系统
2
一种训练扩散模型以及图像质量恢复的方法
噪声图像 样本 噪声预测 编码器 编解码
3
一种异形曲面玻璃幕墙安装逆向建模数据采集方法
曲面玻璃幕墙 数据采集方法 施工误差 三维激光扫描设备 三维模型
4
一种基于人工智能联邦学习的智慧海洋数据安全共享与分级灾害预警系统
智慧海洋 数据共享特征 海洋灾害 联邦深度学习 智能诊断算法
5
一种利用氮气作为喷涂介质的保险杠喷涂方法
保险杠喷涂方法 氮气 喷涂机器人 介质 管路
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号