摘要
本申请实施例提供了一种大语言模型的参数剪枝方法、装置、设备及可读存储介质。方法包括:获取预设大语言模型中每个网络层的第一度量矩阵,并确定对应网络层的剪枝率;针对每个网络层包含的多个注意力头确定多个重要性得分,并构建第二度量矩阵;根据剪枝率和第二度量矩阵确定第二度量矩阵的第一标定矩阵,并基于第一标定矩阵的稀疏分布特性得到第一掩码矩阵;对键通道和值通道进行剪枝;根据目标数量和第二度量矩阵确定第二度量矩阵的第二标定矩阵,并基于第二标定矩阵的稀疏分布特性得到第二掩码矩阵;对第二掩码矩阵关联的查询通道和输出通道进行剪枝,得到大语言模型。以此,能够减少大语言模型的存储空间,加速大语言模型的计算效率。
技术关键词
度量
掩码矩阵
大语言模型
剪枝方法
注意力
元素
通道
线性
参数
关系
自然语言
计算机设备
剪枝装置
比率
数值
模块
处理器
可读存储介质
存储器
系统为您推荐了相关专利信息
RNN神经网络
策略
轨迹
LSTM神经网络
计算器
文本特征向量
视频剪辑方法
语义检索模型
字幕
元素
交通流预测方法
交通流量预测
模式
注意力机制
矩阵