摘要
本发明提供了一种融合剪枝量化联合优化的模型压缩方法,包括:获取待剪枝的模型;获取为模型构建的量化模块,其通过可学习的量化参数对模型的可训练参数进行量化以得到对应的量化值,其中,每个可训练参数对应的量化值比其自身的数据量更小;利用训练语料对模型和量化模块进行剪枝和量化优化的联合训练,得到经联合训练后的模型和量化模块,其中,训练时的正向传播中用可训练参数对应的量化值来暂代可训练参数进行计算,反向传播中以最小化预设的总损失函数的值为目标对可训练参数和量化参数进行更新;对经联合训练后的模型进行剪枝,得到剪枝后的模型;利用经联合训练后的量化模块对剪枝后的模型中的可训练参数进行量化,得到经量化后的模型。
技术关键词
模型压缩方法
缩放参数
模块
计算机程序产品
自然语言
处理器
指令
存储器
指标
电子设备
偏差
系统为您推荐了相关专利信息
融合特征
样本
注意力机制
训练深度学习模型
资源推荐方法
掩码矩阵
依存句法分析
气象预测技术
节点特征
文本
知识图谱查询
智能问答系统
查询主体
意图识别
查询意图