大语言模型的参数剪枝方法、装置、设备及可读存储介质

AITNT
正文
推荐专利
大语言模型的参数剪枝方法、装置、设备及可读存储介质
申请号:CN202510320883
申请日期:2025-03-18
公开号:CN119849579B
公开日期:2025-06-24
类型:发明专利
摘要
本申请实施例提供了一种大语言模型的参数剪枝方法、装置、设备及可读存储介质。方法包括:获取预设大语言模型中每个网络层的第一度量矩阵,并确定对应网络层的剪枝率;针对每个网络层包含的多个注意力头确定多个重要性得分,并构建第二度量矩阵;根据剪枝率和第二度量矩阵确定第二度量矩阵的第一标定矩阵,并基于第一标定矩阵的稀疏分布特性得到第一掩码矩阵;对键通道和值通道进行剪枝;根据目标数量和第二度量矩阵确定第二度量矩阵的第二标定矩阵,并基于第二标定矩阵的稀疏分布特性得到第二掩码矩阵;对第二掩码矩阵关联的查询通道和输出通道进行剪枝,得到大语言模型。以此,能够减少大语言模型的存储空间,加速大语言模型的计算效率。
技术关键词
度量 掩码矩阵 大语言模型 剪枝方法 注意力 元素 通道 线性 参数 关系 自然语言 计算机设备 剪枝装置 比率 数值 模块 处理器 可读存储介质 存储器
系统为您推荐了相关专利信息
1
基于知识引导和模态动态注意力融合的多模态情感分析方法
情感分析方法 注意力 模态特征 动态 视觉
2
一种防御型AIGC对抗智能体及其训练方法
RNN神经网络 策略 轨迹 LSTM神经网络 计算器
3
视频剪辑方法、装置、存储介质及电子设备
文本特征向量 视频剪辑方法 语义检索模型 字幕 元素
4
目标跟踪方法及装置
跟踪方法 语义特征 融合特征 图像 标识
5
基于时间感知的动态图卷积长期交通流预测方法
交通流预测方法 交通流量预测 模式 注意力机制 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号