大语言模型剪枝方法、装置、存储介质、程序产品

正文

推荐专利

申请号：CN202510454237

申请日期：2025-04-11

公开号：CN120317305A

公开日期：2025-07-15

类型：发明专利

摘要

本发明提出一种大语言模型剪枝方法、装置、存储介质、程序产品，该方法包括：获取预训练的大语言模型及对应的文本数据集；通过迭代激活依赖神经元，识别大语言模型中相互依赖的耦合组，将耦合组作为剪枝的基本单元；基于耦合组，对组内参数进行粗粒度评估和细粒度评估，融合计算参数重要性生成剪枝掩码；根据剪枝掩码通过剪枝操作移除模型中的冗余参数；对剪枝后的模型进行参数优化，并通过文本数据集进行微调，生成目标大语言模型；将目标大语言模型部署至计算设备，执行文本生成或语义分析任务，并统计任务准确率与模型压缩率。该方法不仅有效的降低了模型的参数量使部署简单，还提升了剪枝后模型对下游任务处理的准确性。

技术关键词

大语言模型剪枝方法度量文本参数通道输出特征样本剪枝装置矩阵数据计算机程序产品重构误差语义模块自然语言平方根可读存储介质处理器

系统为您推荐了相关专利信息

一种基于图像识别的中药材识别方法

中药材识别方法语义注意力数据计算方法注意力机制

一种基于标签感知注意力引导的关系抽取方法

关系抽取方法注意力标签字符串匹配算法大语言模型

一种考虑井筒携砂液体运移过程的多簇裂缝非均衡扩展模拟方法

携砂液体完井流固耦合模型支撑剂颗粒网格

一种用于电力开关的短路保护的门极驱动方法

门极驱动电压扫频信号发生器等效电路模型短路驱动方法

向孕产用户提供服务的方法及装置

高风险处理器数据分析模块机器学习模型指令

大语言模型剪枝方法、装置、存储介质、程序产品

站点导航

APP 下载