大语言模型剪枝方法、装置、存储介质、程序产品

AITNT
正文
推荐专利
大语言模型剪枝方法、装置、存储介质、程序产品
申请号:CN202510454237
申请日期:2025-04-11
公开号:CN120317305A
公开日期:2025-07-15
类型:发明专利
摘要
本发明提出一种大语言模型剪枝方法、装置、存储介质、程序产品,该方法包括:获取预训练的大语言模型及对应的文本数据集;通过迭代激活依赖神经元,识别大语言模型中相互依赖的耦合组,将耦合组作为剪枝的基本单元;基于耦合组,对组内参数进行粗粒度评估和细粒度评估,融合计算参数重要性生成剪枝掩码;根据剪枝掩码通过剪枝操作移除模型中的冗余参数;对剪枝后的模型进行参数优化,并通过文本数据集进行微调,生成目标大语言模型;将目标大语言模型部署至计算设备,执行文本生成或语义分析任务,并统计任务准确率与模型压缩率。该方法不仅有效的降低了模型的参数量使部署简单,还提升了剪枝后模型对下游任务处理的准确性。
技术关键词
大语言模型 剪枝方法 度量 文本 参数 通道 输出特征 样本 剪枝装置 矩阵 数据 计算机程序产品 重构误差 语义 模块 自然语言 平方根 可读存储介质 处理器
系统为您推荐了相关专利信息
1
一种基于图像识别的中药材识别方法
中药材识别方法 语义注意力 数据 计算方法 注意力机制
2
一种基于标签感知注意力引导的关系抽取方法
关系抽取方法 注意力 标签 字符串匹配算法 大语言模型
3
一种考虑井筒携砂液体运移过程的多簇裂缝非均衡扩展模拟方法
携砂液体 完井 流固耦合模型 支撑剂颗粒 网格
4
一种用于电力开关的短路保护的门极驱动方法
门极驱动电压 扫频信号发生器 等效电路模型 短路 驱动方法
5
向孕产用户提供服务的方法及装置
高风险 处理器 数据分析模块 机器学习模型 指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号