摘要
本发明涉及大语言模型技术领域,特别涉及一种基于低秩压缩的大语言模型加速方法及实现装置。该基于低秩压缩的大语言模型加速方法,使用自适应交叉近似算法对大语言模型的权重矩阵进行矩阵压缩分解,并得到权重矩阵的秩;然后再将权重矩阵的秩应用到基于LoRA微调过程中的低秩参数化更新矩阵上,作为其设定的秩进行微调训练,实现更新矩阵秩的自适应设置。该基于低秩压缩的大语言模型加速方法及实现装置,不仅降低了大语言模型在部署过程中的存储资源需求,还实现了微调过程中低秩参数化更新矩阵秩取值的自适应匹配,提高了应用的普适性,降低了大语言模型的使用算力门槛,加速了大语言模型的落地应用。
技术关键词
矩阵
模型加速方法
近似误差
近似算法
元素
大语言模型
索引
模型预训练
深度神经网络
存储模块
可读存储介质
存储计算机程序
加速设备
复杂度
格式
参数
门槛
处理器
存储器
系统为您推荐了相关专利信息
激光测距组件
三维标定方法
指示灯
红外相机
机器人
单通道脑电信号
混合卷积神经网络
注意力
按摩椅
深度学习分类
情感分析方法
节点
联合损失函数
模态特征
生成器网络
组织病理图像
语义分割方法
矩阵
隶属度函数
特征金字塔网络