一种融合低秩矩阵分解与结构化剪枝的Transformer模型压缩方法

正文

推荐专利

申请号：CN202510847987

申请日期：2025-06-24

公开号：CN120725073A

公开日期：2025-09-30

类型：发明专利

摘要

本发明涉及神经网络模型压缩技术领域，公开一种融合低秩矩阵分解与结构化剪枝的Transformer模型压缩方法，包括：定义约束条件，并基于约束条件确定优化目标；为待压缩模型的每个待剪枝权重矩阵增加一个可训练的低秩分解矩阵对；根据每个可训练的低秩分解矩阵对，确定对应原始权重矩阵的重要性分数计算公式；基于模型获得的梯度信息，使用重要性分数计算公式动态更新各权重矩阵的重要性分数；计算注意头重要性分数和神经元重要性分数；根据约束条件、注意头重要性分数和神经元重要性分数生成剪枝策略，并根据剪枝策略对待压缩模型执行剪枝操作；训练并更新执行剪枝操作后模型的低秩分解矩阵，输出压缩后模型。本发明能够有效降低计算量，同时提高训练效率。

技术关键词

模型压缩方法剪枝策略矩阵神经网络模型压缩技术多头注意力机制计算机存储程序动态更新模型剪枝计算机程序产品模块序列定义参数可读存储介质处理器频率

系统为您推荐了相关专利信息

一种配电网的智能故障诊断方法与系统

智能故障诊断方法空间拓扑结构拓扑特征分类器节点

用于荧光纺织材料的荧光性能检测方法、设备及介质

性能检测方法荧光染料样本 DBSCAN算法纺织材料工艺

固定式架车机故障早期定位方法及系统

固定式架车机 SDG模型子系统 T2统计量节点

基于人因智能的脑电信号分离方法、系统及电子设备

掩膜矩阵脑电信号提取训练算法网络特征提取模块

基于遥感地球化学融合数据的含矿伟晶岩识别方法及系统

皮尔逊相关系数识别方法深度度量学习反距离加权插值元素

一种融合低秩矩阵分解与结构化剪枝的Transformer模型压缩方法

站点导航

APP 下载