一种基于输入激活的大语言模型低秩近似剪枝方法和装置

正文

推荐专利

申请号：CN202410753364

申请日期：2024-06-12

公开号：CN118627581A

公开日期：2024-09-10

类型：发明专利

摘要

本发明属于人工智能技术领域，涉及一种基于输入激活的大语言模型低秩近似剪枝方法和装置。该方法包括：根据权重和输入激活计算剪枝指标；根据剪枝指标对大语言模型的线性层的每个输出进行局部权重的比较和修剪；使用低秩近似法对剪枝后的大语言模型进行微调以促进大语言模型性能的恢复。本发明能够有效地压缩LLMs，实现了较高的计算效率，在单个前向传播中执行，并且只有很小的内存开销，不仅避免了在局部分层重建过程中计算逆矩阵，而且保持了与幅值剪枝一样的简洁性。

技术关键词

剪枝方法大语言模型指标存储计算机程序线性剪枝装置可读存储介质人工智能技术计算机设备模式存储器处理器矩阵复杂度内存分层模块定义指令

系统为您推荐了相关专利信息

一种基于一源一日的供热精准调度方法及系统

精准调度方法负荷偏差指标建筑

一种基于SAC的电网日内前瞻调度的决策生成方法及系统

决策生成方法关键断面深度学习模型训练节点电压

一种基于情感大语言模型的学生早期表现预测方法

大语言模型学生融合特征情感特征多层感知机

一种用于模拟滑坡破坏的模型试验箱

模型试验箱直线动力机构绕线轮箱体角度调节机构

一种HPO优化BP神经网络主轴热误差建模方法

优化BP神经网络主轴热误差建模方法神经网络模型高速电主轴

一种基于输入激活的大语言模型低秩近似剪枝方法和装置

站点导航

APP 下载