一种深度神经网络的分段线性混合量化方法

正文

推荐专利

一种深度神经网络的分段线性混合量化方法

申请号：CN202410915395

申请日期：2024-07-09

公开号：CN118886461A

公开日期：2024-11-01

类型：发明专利

摘要

本发明公开了一种深度神经网络的分段线性混合量化方法，涉及智能信息处理领域，所述方法包括：S1：选择深度神经网络模型并获取各层参数；S2：计算每个权重层的敏感度，用聚类方法将敏感度相近的权重层分组，根据分组分配量化精度；S3：获取权重层和激活层各通道数据的范围值，按照范围值进行权重层和激活层各通道的分组并分配量化参数；S4：分段量化每个权重层，寻找能最小化由于量化带来的精度损失的量化方案的最优解；S5：微调量化后的模型，使用预设指标验证微调后的模型。本发明通过聚类和分段量化技术，提升量化效率，并根据层和通道的特性，采用不同量化策略，适用多种模型且量化后精度损失小。

技术关键词

深度神经网络模型分段线性精度表达式 sigmoid函数参数误差补偿技术智能信息处理数据通道矩阵优化器退火算法可读存储介质量化误差程序

一种深度神经网络的分段线性混合量化方法

站点导航

APP 下载