摘要
本发明提供了一种基于预训练模型的视觉神经网络模型剪枝方法,涉及视觉神经网络ViT模型剪枝技术领域,该方法首先加载预训练模型,并初始化一个与模型权重矩阵W相同大小的辅助矩阵w',用于记录每个参数在训练过程中的重要性。在训练过程中,利用数据集和soft target标签更新w'矩阵,反映每个参数对模型输出分类任务的贡献。通过统计用户数据中的分类频率,找出用户最常用的分类类型,并根据此信息筛选出不重要的参数进行剪枝。最后,使用剩余的w'矩阵对模型进行微调,确保剪枝后的模型精度不低于预设要求。本发明能够自适应调整剪枝策略,适用于移动设备或计算资源受限的设备,提高了模型的计算效率和个性化适配能力。
技术关键词
模型剪枝方法
预训练模型
矩阵
剪枝模型
网络
计算资源受限
数据
参数
剪枝策略
标签
反馈系统
频率
移动设备
终端设备
训练集
精度
日志
在线
样本
系统为您推荐了相关专利信息
融合特征
估计方法
神经网络模型
特征值
金字塔池化
光伏电站运维
自主移动机器人
管理方法
条件生成对抗网络
三维卷积神经网络