一种基于低秩压缩的大语言模型加速方法及实现装置

AITNT
正文
推荐专利
一种基于低秩压缩的大语言模型加速方法及实现装置
申请号:CN202410865324
申请日期:2024-07-01
公开号:CN118396068B
公开日期:2024-10-08
类型:发明专利
摘要
本发明涉及大语言模型技术领域,特别涉及一种基于低秩压缩的大语言模型加速方法及实现装置。该基于低秩压缩的大语言模型加速方法,使用自适应交叉近似算法对大语言模型的权重矩阵进行矩阵压缩分解,并得到权重矩阵的秩;然后再将权重矩阵的秩应用到基于LoRA微调过程中的低秩参数化更新矩阵上,作为其设定的秩进行微调训练,实现更新矩阵秩的自适应设置。该基于低秩压缩的大语言模型加速方法及实现装置,不仅降低了大语言模型在部署过程中的存储资源需求,还实现了微调过程中低秩参数化更新矩阵秩取值的自适应匹配,提高了应用的普适性,降低了大语言模型的使用算力门槛,加速了大语言模型的落地应用。
技术关键词
矩阵 模型加速方法 近似误差 近似算法 元素 大语言模型 索引 模型预训练 深度神经网络 存储模块 可读存储介质 存储计算机程序 加速设备 复杂度 格式 参数 门槛 处理器 存储器
系统为您推荐了相关专利信息
1
可选择性重复利用的瓶子的防伪系统及方法
瓶子 客户端 防伪方法 防伪系统 处理器
2
六轴理疗机器人三维标定方法及标定平台
激光测距组件 三维标定方法 指示灯 红外相机 机器人
3
基于小波变换、相空间重构和深度学习的脑控按摩椅系统
单通道脑电信号 混合卷积神经网络 注意力 按摩椅 深度学习分类
4
一种基于上下文感知动态图融合的多模态情感分析方法
情感分析方法 节点 联合损失函数 模态特征 生成器网络
5
基于多元隶属函数的组织病理图像深度语义分割方法
组织病理图像 语义分割方法 矩阵 隶属度函数 特征金字塔网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号