一种结合知识蒸馏及元梯度初始化剪枝的混合压缩方法

正文

推荐专利

申请号：CN202510923512

申请日期：2025-07-04

公开号：CN120745716A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种结合知识蒸馏及元梯度初始化剪枝的混合压缩方法，本发明涉及神经网络模型压缩领域。该结合知识蒸馏及元梯度初始化剪枝的混合压缩方法，首先在HSD阶段，设计参数镜像初始化策略：冻结预训练教师网络参数，并采用拓扑对称的学生网络，通过自蒸馏优化增强参数平滑性及模型性能，得到性能更佳的教师模型。之后使用元梯度初始化剪枝(Prospect Pruning，ProsPr)方法对未经训练的网络进行初始化剪枝，得到稀疏化子网作为下一阶段的学生模型。在剪枝完成后的知识蒸馏阶段，提出稀疏感知温度耦合(Sparsity‑Aware Temperature Coupling mechanism,SATC)机制，通过动态调整教师模型正确类与错误类的蒸馏温度，实现知识迁移强度与剪枝率的自适应匹配，改善因剪枝率过高引起的教师模型和学生模型容量差距过大，导致知识蒸馏效果下降的问题。

技术关键词

混合压缩方法蒸馏教师学生类间区分度模型拓扑结构参数机制剪枝方法模型剪枝预训练模型网络同步动态精度神经网络模型代表阶段镜像策略

一种结合知识蒸馏及元梯度初始化剪枝的混合压缩方法

站点导航

APP 下载