一种基于微调训练的端侧深度神经网络模型压缩方法

正文

推荐专利

申请号：CN202411100854

申请日期：2024-08-12

公开号：CN118643884B

公开日期：2024-12-24

类型：发明专利

摘要

一种基于微调训练的端侧深度神经网络模型压缩方法，包括如下步骤：步骤S1.准备深度神经网络模型作为初始模型；步骤S2.对初始模型中部分层的权重矩阵采用权重分段量化的方式得到量化矩阵替换权重矩阵；步骤S3.进行微调训练，训练过程中，替换了权重矩阵的层参数固定，调整其他未替换权重矩阵的层参数，设置微小学习率进行参数调整，直到达到训练目标；对训练得到的模型进行量化压缩，将量化值分别替换原权重矩阵，得到量化后的模型。本发明对深度神经网络模型进行了压缩，并尽可能少的降低模型推理效果，通过分段量化，能有效减少使得区间内数值波动过大导致求得的量化因子数值分散准确性低的问题，以降低模型量化引入的精度损失。

技术关键词

深度神经网络模型矩阵分段参数因子分层数值语音数据线性元素精度

系统为您推荐了相关专利信息

一种继电保护动作行为诊断方法、系统和介质

图纸继电保护装置随机森林模型诊断方法历史故障数据

基于多参数分析的工程机械主动安全控制方法及装置

主动安全控制方法作业风险多参数控制策略主动安全控制装置

企业科创指数预测方法、装置、计算机设备及存储介质

指数预测方法特征工程基础计算机设备样本

一种基于知识图谱的电力数据融合方法及系统

电力数据融合方法图谱反演框架电力系统实体

基于语音识别飞参软件人机交互方法、装置、设备及介质

人机交互方法构建语音识别模型文本信息传输软件飞参数据处理

一种基于微调训练的端侧深度神经网络模型压缩方法

站点导航

APP 下载