摘要
本发明属于人工智能技术领域,涉及一种基于输入激活的大语言模型低秩近似剪枝方法和装置。该方法包括:根据权重和输入激活计算剪枝指标;根据剪枝指标对大语言模型的线性层的每个输出进行局部权重的比较和修剪;使用低秩近似法对剪枝后的大语言模型进行微调以促进大语言模型性能的恢复。本发明能够有效地压缩LLMs,实现了较高的计算效率,在单个前向传播中执行,并且只有很小的内存开销,不仅避免了在局部分层重建过程中计算逆矩阵,而且保持了与幅值剪枝一样的简洁性。
技术关键词
剪枝方法
大语言模型
指标
存储计算机程序
线性
剪枝装置
可读存储介质
人工智能技术
计算机设备
模式
存储器
处理器
矩阵
复杂度
内存
分层
模块
定义
指令
系统为您推荐了相关专利信息
决策生成方法
关键断面
深度学习模型训练
节点
电压
模型试验箱
直线动力机构
绕线轮
箱体
角度调节机构
优化BP神经网络
主轴热误差
建模方法
神经网络模型
高速电主轴