一种融合低秩矩阵分解与结构化剪枝的Transformer模型压缩方法

AITNT
正文
推荐专利
一种融合低秩矩阵分解与结构化剪枝的Transformer模型压缩方法
申请号:CN202510847987
申请日期:2025-06-24
公开号:CN120725073A
公开日期:2025-09-30
类型:发明专利
摘要
本发明涉及神经网络模型压缩技术领域,公开一种融合低秩矩阵分解与结构化剪枝的Transformer模型压缩方法,包括:定义约束条件,并基于约束条件确定优化目标;为待压缩模型的每个待剪枝权重矩阵增加一个可训练的低秩分解矩阵对;根据每个可训练的低秩分解矩阵对,确定对应原始权重矩阵的重要性分数计算公式;基于模型获得的梯度信息,使用重要性分数计算公式动态更新各权重矩阵的重要性分数;计算注意头重要性分数和神经元重要性分数;根据约束条件、注意头重要性分数和神经元重要性分数生成剪枝策略,并根据剪枝策略对待压缩模型执行剪枝操作;训练并更新执行剪枝操作后模型的低秩分解矩阵,输出压缩后模型。本发明能够有效降低计算量,同时提高训练效率。
技术关键词
模型压缩方法 剪枝策略 矩阵 神经网络模型压缩技术 多头注意力机制 计算机存储程序 动态更新 模型剪枝 计算机程序产品 模块 序列 定义 参数 可读存储介质 处理器 频率
系统为您推荐了相关专利信息
1
一种配电网的智能故障诊断方法与系统
智能故障诊断方法 空间拓扑结构 拓扑特征 分类器 节点
2
用于荧光纺织材料的荧光性能检测方法、设备及介质
性能检测方法 荧光染料 样本 DBSCAN算法 纺织材料工艺
3
固定式架车机故障早期定位方法及系统
固定式架车机 SDG模型 子系统 T2统计量 节点
4
基于人因智能的脑电信号分离方法、系统及电子设备
掩膜矩阵 脑电信号提取 训练算法 网络 特征提取模块
5
基于遥感地球化学融合数据的含矿伟晶岩识别方法及系统
皮尔逊相关系数 识别方法 深度度量学习 反距离加权插值 元素
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号