一种大语言模型加速方法及装置

正文

推荐专利

一种大语言模型加速方法及装置

申请号：CN202411045654

申请日期：2024-08-01

公开号：CN118569324B

公开日期：2025-01-07

类型：发明专利

摘要

本发明涉及人工智能领域，本发明要解决的技术问题为如何简化存储资源和计算资源，进行大语言模型的推广。采用的技术方案为一种大语言模型加速方法及装置，具有如下步骤：S1、将大语言模型的预训练权重矩阵W进行压缩分解；S2、分别对U和VT矩阵进行QR分解，得到QU、RU、QV、RV；S3、使用奇异值分解算法对矩阵乘积进行压缩分解；S4、将矩阵分别合并；S5、将得到的矩阵替换权重矩阵W进行存储；S6、使用存储的矩阵进行推理加速；S7、将得到的秩r设置成为对应权重矩阵W的低秩参数化更新矩阵ΔW的秩；S8、使用存储的矩阵进行微调后大语言模型的推理加速。

技术关键词

矩阵大语言模型奇异值分解算法复杂度存储模块加速装置参数文本误差规模

系统为您推荐了相关专利信息

汽车碰撞安全仿真模型方位设置方法、数据模型和系统

包络仿真模型车辆模型方位角线段

一种视频动作检测的提示裁剪方法

关键帧标记裁剪方法动作检测模型视频动作识别

基于弹性联邦低秩适配微调的大语言模型训练方法及系统

语言模型训练方法矩阵客户端语言模型训练系统服务器

一种基于历史传播结果的传播网络重构方法及装置

网络重构方法矩阵节点遗传算法元素

一种诊断或预测孤独症的微生物标志物组合、系统和应用

数据输入模块逻辑回归算法机器学习算法构建预测模型样本

一种大语言模型加速方法及装置

站点导航

APP 下载