一种基于低秩压缩的大语言模型加速方法及实现装置

正文

推荐专利

申请号：CN202410865324

申请日期：2024-07-01

公开号：CN118396068B

公开日期：2024-10-08

类型：发明专利

摘要

本发明涉及大语言模型技术领域，特别涉及一种基于低秩压缩的大语言模型加速方法及实现装置。该基于低秩压缩的大语言模型加速方法，使用自适应交叉近似算法对大语言模型的权重矩阵进行矩阵压缩分解，并得到权重矩阵的秩；然后再将权重矩阵的秩应用到基于LoRA微调过程中的低秩参数化更新矩阵上，作为其设定的秩进行微调训练，实现更新矩阵秩的自适应设置。该基于低秩压缩的大语言模型加速方法及实现装置，不仅降低了大语言模型在部署过程中的存储资源需求，还实现了微调过程中低秩参数化更新矩阵秩取值的自适应匹配，提高了应用的普适性，降低了大语言模型的使用算力门槛，加速了大语言模型的落地应用。

技术关键词

矩阵模型加速方法近似误差近似算法元素大语言模型索引模型预训练深度神经网络存储模块可读存储介质存储计算机程序加速设备复杂度格式参数门槛处理器存储器

系统为您推荐了相关专利信息

可选择性重复利用的瓶子的防伪系统及方法

瓶子客户端防伪方法防伪系统处理器

六轴理疗机器人三维标定方法及标定平台

激光测距组件三维标定方法指示灯红外相机机器人

基于小波变换、相空间重构和深度学习的脑控按摩椅系统

单通道脑电信号混合卷积神经网络注意力按摩椅深度学习分类

一种基于上下文感知动态图融合的多模态情感分析方法

情感分析方法节点联合损失函数模态特征生成器网络

基于多元隶属函数的组织病理图像深度语义分割方法

组织病理图像语义分割方法矩阵隶属度函数特征金字塔网络

一种基于低秩压缩的大语言模型加速方法及实现装置

站点导航

APP 下载