摘要
一种基于离群值分离激活值混合量化的神经网络优化方法,采用Z‑Score方式将预处理后的激活值分解为离群值和正常值后,分别对正常值使用采用4bit分组量化、对于离群值采用8bit量化并保存到显存中,在反向传播计算到该层时对保存的量化后离群值和正常值进行恢复处理实现优化。本发明能够减小前向传播后保存在显存中的激活值大小,保证模型可以训练的同时,显著减小所有层前向传播之后保存的总激活值大小,相比其他技术,能够提供更高吞吐率,并且能够尽可能减小量化误差。
技术关键词
神经网络优化方法
神经网络优化系统
通道
因子
量化误差
分析单元
分布式训练
存储单元
切片方式
内存
处理单元
元素
压缩器
标记
数据
参数
符号
图片
模块
系统为您推荐了相关专利信息
洗碗机
负荷预测模型
碳减排方法
家庭
节假日信息
风险预测模型
数据采集分析系统
指标
智能化医疗
分析医疗数据
规划算法
数据处理方法
变量
计算机程序产品
风险