摘要
本公开涉及一种模型压缩方法、装置、电子设备、存储介质、系统和计算机程序产品,所述方法包括:将训练数据分别输入到待压缩模型和教师模型,得到待压缩模型的输出和教师模型的输出,待压缩模型和教师模型的网络结构相同,教师模型是预先训练得到的,待压缩模型是随机初始化得到的;基于待压缩模型的输出,通过门控网络剪枝模块对待压缩模型进行剪枝,得到学生模型;将训练数据输入到学生模型,得到学生模型的输出;基于学生模型的输出和教师模型的输出,计算蒸馏损失;基于蒸馏损失对待压缩模型和门控网络剪枝模块进行训练;通过训练好的门控网络剪枝模块对训练好的待压缩模型进行剪枝,得到压缩后的模型。解决了简化网络性能不佳的问题。
技术关键词
模型压缩方法
网络剪枝
特征提取模块
注意力
教师
学生
蒸馏
计算机程序产品
sigmoid函数
掩膜
网络结构
自然语言
处理器
计算机可执行指令
积层
图像处理
电子设备
系统为您推荐了相关专利信息
飞行器气动特性
智能重构方法
权重模型
气动力特性研究
数据
糖尿病视网膜病变
病灶分割方法
注意力
卷积模块
图像增强
广告出价方法
数据
广告主
交互特征
引入注意力机制
综合能源系统
热电联产机组
能量管理策略
注意力机制
网络