摘要
本发明公开了一种基于梯度缩放校正的量化神经网络训练方法,其中,神经网络模型用于部署在边缘设备上执行推理任务,所述方法包括以下步骤:基于后训练量化方法对预训练的神经网络模型进行量化参数处理,获得量化模型;基于待训练数据集对量化模型进行前向传播;对量化模型的输出结果进行反量化,然后基于损失函数进行处理并向后传播;基于梯度缩放校正方法对量化模型的各层梯度进行缩放处理;基于缩放后的梯度对量化模型的网络参数进行更新。本发明提出的训练方法能够避免神经网络训练过程出现的梯度扭曲和激活分布异常,能够直接完成神经网络模型的有效训练。
技术关键词
神经网络训练方法
神经网络模型
校正方法
参数
处理器
可读存储介质
存储器
数据
电子设备
程序
因子
系统为您推荐了相关专利信息
量子遗传算法
优化配置方法
量子旋转门
电力系统应急
染色体
轴承故障诊断方法
故障诊断模型
特征提取器
故障类别
注意力
居民楼
交换机
远程抄表系统
异常信号
信息采集模块
浅海水深反演方法
支持向量机模型
偏最小二乘法
卫星遥感影像
反射率数据