基于神经网络的量化方法、装置、芯片、存储介质及程序产品

AITNT
正文
推荐专利
基于神经网络的量化方法、装置、芯片、存储介质及程序产品
申请号:CN202411593515
申请日期:2024-11-08
公开号:CN119721142A
公开日期:2025-03-28
类型:发明专利
摘要
本申请公开了一种基于神经网络的量化方法、装置、芯片、存储介质及程序产品。方法包括生成初始化数据和模拟数据;通过待量化模型处理初始化数据,以确定各个批量归一化层的松弛分布系数;通过待量化模型分别处理各个模拟数据,以确定各个批量归一化层的输出数据的第二均值和第二方差;确定批量归一化层的总损失,批量归一化层的总损失基于松弛分布系数、及各个批量归一化层对应的第二均值和第二方差;基于批量归一化层的总损失对模拟数据进行迭代,直至确定使得批量归一化层的总损失满足预设条件的目标数据,目标数据用于对待量化模型进行量化,以生成量化模型。可在无数据的情况下,生成用于模型量化的目标数据,从而量化模型,提升模型性能。
技术关键词
批量 数据 松弛 非暂态计算机可读存储介质 计算机程序产品 芯片 模块 处理器 矩阵 尺寸
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号