摘要
本申请公开了一种基于神经网络的量化方法、装置、芯片、存储介质及程序产品。方法包括生成初始化数据和模拟数据;通过待量化模型处理初始化数据,以确定各个批量归一化层的松弛分布系数;通过待量化模型分别处理各个模拟数据,以确定各个批量归一化层的输出数据的第二均值和第二方差;确定批量归一化层的总损失,批量归一化层的总损失基于松弛分布系数、及各个批量归一化层对应的第二均值和第二方差;基于批量归一化层的总损失对模拟数据进行迭代,直至确定使得批量归一化层的总损失满足预设条件的目标数据,目标数据用于对待量化模型进行量化,以生成量化模型。可在无数据的情况下,生成用于模型量化的目标数据,从而量化模型,提升模型性能。
技术关键词
批量
数据
松弛
非暂态计算机可读存储介质
计算机程序产品
芯片
模块
处理器
矩阵
尺寸