摘要
本发明涉及神经网络模型压缩技术领域,公开一种融合低秩矩阵分解与结构化剪枝的Transformer模型压缩方法,包括:定义约束条件,并基于约束条件确定优化目标;为待压缩模型的每个待剪枝权重矩阵增加一个可训练的低秩分解矩阵对;根据每个可训练的低秩分解矩阵对,确定对应原始权重矩阵的重要性分数计算公式;基于模型获得的梯度信息,使用重要性分数计算公式动态更新各权重矩阵的重要性分数;计算注意头重要性分数和神经元重要性分数;根据约束条件、注意头重要性分数和神经元重要性分数生成剪枝策略,并根据剪枝策略对待压缩模型执行剪枝操作;训练并更新执行剪枝操作后模型的低秩分解矩阵,输出压缩后模型。本发明能够有效降低计算量,同时提高训练效率。
技术关键词
模型压缩方法
剪枝策略
矩阵
神经网络模型压缩技术
多头注意力机制
计算机存储程序
动态更新
模型剪枝
计算机程序产品
模块
序列
定义
参数
可读存储介质
处理器
频率
系统为您推荐了相关专利信息
智能故障诊断方法
空间拓扑结构
拓扑特征
分类器
节点
性能检测方法
荧光染料
样本
DBSCAN算法
纺织材料工艺
固定式架车机
SDG模型
子系统
T2统计量
节点
掩膜矩阵
脑电信号提取
训练算法
网络
特征提取模块
皮尔逊相关系数
识别方法
深度度量学习
反距离加权插值
元素