一种降低剪枝对神经网络模型造成的性能损失的方法

正文

推荐专利

申请号：CN202510645060

申请日期：2025-05-19

公开号：CN120562504A

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开了一种降低剪枝对神经网络模型造成的性能损失的方法，包括如下步骤：S1:在模型Transformer层的自注意力模块和层间输入输出端插入可学习的正交矩阵，对权重和输入进行旋转变换；S2:基于旋转变换后的权重和输入矩阵，计算不同剪枝方法对应的重要性分数；将重要性分数归一化为概率分布，通过最小化信息熵将权重重要性集中于少数参数；固定原始模型权重，结合归一化重要性分数与信息熵最小化目标，训练正交矩阵直至收敛；S3:将所述正交矩阵的旋转效果合并至模型权重，形成优化权重矩阵；S4:利用现有剪枝方法移除低重要性参数，执行剪枝操作。本发明通过在剪枝前对模型权重施加可学习的正交变换，重构权重重要性分布以增强模型剪枝适应性。

技术关键词

剪枝方法矩阵神经网络模型信息熵注意力参数模型剪枝正交变换模块重构输出端模式

系统为您推荐了相关专利信息

一种大规模地球物理数据高效反演算法

地球物理数据反演算法牛顿迭代法模型更新预测误差

一种基于强化学习的功放线性化热补偿方法

数字预失真模型热补偿方法网络模块强化学习网络特征提取模块

一种海上风电桩基碎石分布声呐检测方法及装置

分形特征海上风电桩基粗糙度算法矩阵元素

一种用于自动语音识别推测解码的草稿序列复用方法

自动语音识别复用方法序列文本注意力

一种磁共振电特性成像模型构建方法、装置、设备及介质

成像模型构建方法磁共振人工神经网络神经网络模型 T1加权图像

一种降低剪枝对神经网络模型造成的性能损失的方法

站点导航

APP 下载