一种基于预训练模型的视觉神经网络模型剪枝方法

正文

推荐专利

申请号：CN202411880174

申请日期：2024-12-19

公开号：CN119990230A

公开日期：2025-05-13

类型：发明专利

摘要

本发明提供了一种基于预训练模型的视觉神经网络模型剪枝方法，涉及视觉神经网络ViT模型剪枝技术领域，该方法首先加载预训练模型，并初始化一个与模型权重矩阵W相同大小的辅助矩阵w'，用于记录每个参数在训练过程中的重要性。在训练过程中，利用数据集和soft target标签更新w'矩阵，反映每个参数对模型输出分类任务的贡献。通过统计用户数据中的分类频率，找出用户最常用的分类类型，并根据此信息筛选出不重要的参数进行剪枝。最后，使用剩余的w'矩阵对模型进行微调，确保剪枝后的模型精度不低于预设要求。本发明能够自适应调整剪枝策略，适用于移动设备或计算资源受限的设备，提高了模型的计算效率和个性化适配能力。

技术关键词

模型剪枝方法预训练模型矩阵剪枝模型网络计算资源受限数据参数剪枝策略标签反馈系统频率移动设备终端设备训练集精度日志在线样本

系统为您推荐了相关专利信息

一种基于分层多尺度拓扑增强网络的驾驶员警戒估计方法

融合特征估计方法神经网络模型特征值金字塔池化

一种基于物联网的精确的电能监测系统

电能监测系统电压互感器芯片接口 SPI总线

蓄电池放电电压预测方法、装置、电子设备及存储介质

放电电压预测方法超参数时间差序列样本

一种用于食源性疾病监测平台的智能检测系统及方法

食源性疾病智能检测方法样本监测平台指标

一种智能化光伏电站运维管理方法及系统

光伏电站运维自主移动机器人管理方法条件生成对抗网络三维卷积神经网络

一种基于预训练模型的视觉神经网络模型剪枝方法

站点导航

APP 下载