大语言模型的参数剪枝方法、装置、设备及可读存储介质

正文

推荐专利

申请号：CN202510320883

申请日期：2025-03-18

公开号：CN119849579B

公开日期：2025-06-24

类型：发明专利

摘要

本申请实施例提供了一种大语言模型的参数剪枝方法、装置、设备及可读存储介质。方法包括：获取预设大语言模型中每个网络层的第一度量矩阵，并确定对应网络层的剪枝率；针对每个网络层包含的多个注意力头确定多个重要性得分，并构建第二度量矩阵；根据剪枝率和第二度量矩阵确定第二度量矩阵的第一标定矩阵，并基于第一标定矩阵的稀疏分布特性得到第一掩码矩阵；对键通道和值通道进行剪枝；根据目标数量和第二度量矩阵确定第二度量矩阵的第二标定矩阵，并基于第二标定矩阵的稀疏分布特性得到第二掩码矩阵；对第二掩码矩阵关联的查询通道和输出通道进行剪枝，得到大语言模型。以此，能够减少大语言模型的存储空间，加速大语言模型的计算效率。

技术关键词

度量掩码矩阵大语言模型剪枝方法注意力元素通道线性参数关系自然语言计算机设备剪枝装置比率数值模块处理器可读存储介质存储器

系统为您推荐了相关专利信息

基于知识引导和模态动态注意力融合的多模态情感分析方法

情感分析方法注意力模态特征动态视觉

一种防御型AIGC对抗智能体及其训练方法

RNN神经网络策略轨迹 LSTM神经网络计算器

视频剪辑方法、装置、存储介质及电子设备

文本特征向量视频剪辑方法语义检索模型字幕元素

目标跟踪方法及装置

跟踪方法语义特征融合特征图像标识

基于时间感知的动态图卷积长期交通流预测方法

交通流预测方法交通流量预测模式注意力机制矩阵

大语言模型的参数剪枝方法、装置、设备及可读存储介质

站点导航

APP 下载