一种大语言模型加速方法及装置

AITNT
正文
推荐专利
一种大语言模型加速方法及装置
申请号:CN202411045654
申请日期:2024-08-01
公开号:CN118569324B
公开日期:2025-01-07
类型:发明专利
摘要
本发明涉及人工智能领域,本发明要解决的技术问题为如何简化存储资源和计算资源,进行大语言模型的推广。采用的技术方案为一种大语言模型加速方法及装置,具有如下步骤:S1、将大语言模型的预训练权重矩阵W进行压缩分解;S2、分别对U和VT矩阵进行QR分解,得到QU、RU、QV、RV;S3、使用奇异值分解算法对矩阵乘积进行压缩分解;S4、将矩阵分别合并;S5、将得到的矩阵替换权重矩阵W进行存储;S6、使用存储的矩阵进行推理加速;S7、将得到的秩r设置成为对应权重矩阵W的低秩参数化更新矩阵ΔW的秩;S8、使用存储的矩阵进行微调后大语言模型的推理加速。
技术关键词
矩阵 大语言模型 奇异值分解算法 复杂度 存储模块 加速装置 参数 文本 误差 规模
系统为您推荐了相关专利信息
1
汽车碰撞安全仿真模型方位设置方法、数据模型和系统
包络 仿真模型 车辆模型 方位角 线段
2
一种视频动作检测的提示裁剪方法
关键帧 标记 裁剪方法 动作检测模型 视频动作识别
3
基于弹性联邦低秩适配微调的大语言模型训练方法及系统
语言模型训练方法 矩阵 客户端 语言模型训练系统 服务器
4
一种基于历史传播结果的传播网络重构方法及装置
网络重构方法 矩阵 节点 遗传算法 元素
5
一种诊断或预测孤独症的微生物标志物组合、系统和应用
数据输入模块 逻辑回归算法 机器学习算法 构建预测模型 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号