一种基于对抗学习与稀疏正则的大模型压缩方法和系统

正文

推荐专利

申请号：CN202510264555

申请日期：2025-03-06

公开号：CN120373394A

公开日期：2025-07-25

类型：发明专利

摘要

本发明提出了一种基于对抗学习与稀疏正则的大模型压缩方法和系统，首先通过带有掩码的多头注意力机制裁剪贡献少的注意力头，以减少参数量；其次，针对FFN结构进行稀疏约束的残差结构剪枝，优化残差结构的同时避免信息流堵塞；还引入了自适应阈值，以减少无效计算；最后，结合对抗学习范式与源模型特征的正则约束，将超参数对剪枝模型的影响分担到判别器中，使用FISTA优化方法即优化判别器，进一步提高剪枝训练的稳定性。本发明通过将对抗学习的范式应用到大模型剪枝任务当中，实现了对大模型单阶段的剪枝，剪枝后的模型不需要经过微调即可保持源模型相近的推理效果，这一设计大大减少了计算负担和计算成本。

技术关键词

剪枝模型编码特征模型压缩方法门控神经网络残差结构参数位置编码信息矩阵模型更新随机梯度下降模型剪枝残差模块表达式文本策略更新多头注意力机制输出特征

系统为您推荐了相关专利信息

一种有害气体浓度智能识别与检测方法

气体解码函数多通道特征一维卷积神经网络解码网络

一种语音识别方法及相关装置、设备和存储介质

语音识别模型编码特征样本解码网络语音识别方法

基于迁移学习的跨院医疗数据适配系统

数据适配系统医院在线增量学习多模态数据融合多粒度特征

基于孪生剪枝注意力神经网络的脑龄预测方法

处理单元注意力神经网络静息态功能磁共振成像联合损失函数特征提取器

图像处理方法及系统

图像压缩图像处理模型图像编码颜色编码特征

一种基于对抗学习与稀疏正则的大模型压缩方法和系统

站点导航

APP 下载