一种基于微调训练的端侧深度神经网络模型压缩方法

AITNT
正文
推荐专利
一种基于微调训练的端侧深度神经网络模型压缩方法
申请号:CN202411100854
申请日期:2024-08-12
公开号:CN118643884B
公开日期:2024-12-24
类型:发明专利
摘要
一种基于微调训练的端侧深度神经网络模型压缩方法,包括如下步骤:步骤S1.准备深度神经网络模型作为初始模型;步骤S2.对初始模型中部分层的权重矩阵采用权重分段量化的方式得到量化矩阵替换权重矩阵;步骤S3.进行微调训练,训练过程中,替换了权重矩阵的层参数固定,调整其他未替换权重矩阵的层参数,设置微小学习率进行参数调整,直到达到训练目标;对训练得到的模型进行量化压缩,将量化值分别替换原权重矩阵,得到量化后的模型。本发明对深度神经网络模型进行了压缩,并尽可能少的降低模型推理效果,通过分段量化,能有效减少使得区间内数值波动过大导致求得的量化因子数值分散准确性低的问题,以降低模型量化引入的精度损失。
技术关键词
深度神经网络模型 矩阵 分段 参数 因子 分层 数值 语音 数据 线性 元素 精度
系统为您推荐了相关专利信息
1
一种继电保护动作行为诊断方法、系统和介质
图纸 继电保护装置 随机森林模型 诊断方法 历史故障数据
2
基于多参数分析的工程机械主动安全控制方法及装置
主动安全控制方法 作业风险 多参数 控制策略 主动安全控制装置
3
企业科创指数预测方法、装置、计算机设备及存储介质
指数预测方法 特征工程 基础 计算机设备 样本
4
一种基于知识图谱的电力数据融合方法及系统
电力数据融合方法 图谱 反演框架 电力系统 实体
5
基于语音识别飞参软件人机交互方法、装置、设备及介质
人机交互方法 构建语音识别模型 文本信息传输 软件 飞参数据处理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号