摘要
本发明公开了一种基于β散度与软近似映射的深度神经网络量化方法和系统。本发明对网络每个批次的输入数据进行动态分布统计获取数据分布信息,引入AIC作为分布拟合优度的评价指标,在正态、Laplace与广义高斯等多种分布模型中动态选择最优拟合分布,精确确定最佳的量化区间;接着构建可导的软舍入近似函数,设计动态斜率调节机制,根据每一层激活输出的方差自适应调整映射函数斜率参数,使其在不同分布状态下实现量化与精度的动态平衡。在网络训练完成后,记录原始浮点数权重,进行对称量化得到8比特有符号位整数权重,并使用改进的β散度度量量化前后权重分布的差异,在重训练阶段引导量化权重逼近原始浮点权重分布,从而缩小量化误差。
技术关键词
浮点数
数据分布特征
深度神经网络训练
直方图
拉普拉斯
Sigmoid函数
广义
分箱
动态
量化系统
符号
存储计算机程序
量化误差
中间层
机制
参数
系统为您推荐了相关专利信息
乳腺超声影像
回声
图像特征提取方法
灰度特征
全局特征融合
教育机器人
多模态数据分析方法
数据分析模块
热插拔接口
心理量表
动态响应模型
故障诊断方法
系统传递函数
永磁
电压
矩阵
哈希检索方法
注意力机制
文本特征值
图像特征值