摘要
一种基于微调训练的端侧深度神经网络模型压缩方法,包括如下步骤:步骤S1.准备深度神经网络模型作为初始模型;步骤S2.对初始模型中部分层的权重矩阵采用权重分段量化的方式得到量化矩阵替换权重矩阵;步骤S3.进行微调训练,训练过程中,替换了权重矩阵的层参数固定,调整其他未替换权重矩阵的层参数,设置微小学习率进行参数调整,直到达到训练目标;对训练得到的模型进行量化压缩,将量化值分别替换原权重矩阵,得到量化后的模型。本发明对深度神经网络模型进行了压缩,并尽可能少的降低模型推理效果,通过分段量化,能有效减少使得区间内数值波动过大导致求得的量化因子数值分散准确性低的问题,以降低模型量化引入的精度损失。
技术关键词
深度神经网络模型
矩阵
分段
参数
因子
分层
数值
语音
数据
线性
元素
精度
系统为您推荐了相关专利信息
图纸
继电保护装置
随机森林模型
诊断方法
历史故障数据
主动安全控制方法
作业风险
多参数
控制策略
主动安全控制装置
人机交互方法
构建语音识别模型
文本信息传输
软件
飞参数据处理