一种基于输入激活的大语言模型低秩近似剪枝方法和装置

AITNT
正文
推荐专利
一种基于输入激活的大语言模型低秩近似剪枝方法和装置
申请号:CN202410753364
申请日期:2024-06-12
公开号:CN118627581A
公开日期:2024-09-10
类型:发明专利
摘要
本发明属于人工智能技术领域,涉及一种基于输入激活的大语言模型低秩近似剪枝方法和装置。该方法包括:根据权重和输入激活计算剪枝指标;根据剪枝指标对大语言模型的线性层的每个输出进行局部权重的比较和修剪;使用低秩近似法对剪枝后的大语言模型进行微调以促进大语言模型性能的恢复。本发明能够有效地压缩LLMs,实现了较高的计算效率,在单个前向传播中执行,并且只有很小的内存开销,不仅避免了在局部分层重建过程中计算逆矩阵,而且保持了与幅值剪枝一样的简洁性。
技术关键词
剪枝方法 大语言模型 指标 存储计算机程序 线性 剪枝装置 可读存储介质 人工智能技术 计算机设备 模式 存储器 处理器 矩阵 复杂度 内存 分层 模块 定义 指令
系统为您推荐了相关专利信息
1
一种基于一源一日的供热精准调度方法及系统
精准调度方法 负荷 偏差 指标 建筑
2
一种基于SAC的电网日内前瞻调度的决策生成方法及系统
决策生成方法 关键断面 深度学习模型训练 节点 电压
3
一种基于情感大语言模型的学生早期表现预测方法
大语言模型 学生 融合特征 情感特征 多层感知机
4
一种用于模拟滑坡破坏的模型试验箱
模型试验箱 直线动力机构 绕线轮 箱体 角度调节机构
5
一种HPO优化BP神经网络主轴热误差建模方法
优化BP神经网络 主轴热误差 建模方法 神经网络模型 高速电主轴
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号