摘要
本申请涉及一种用于大语言模型推理系统的LoRA权重融合方法及装置。该方法包括:大语言模型推理系统获取多个LoRA权重数据;确定多个LoRA权重数据对应的融合比例;基于所述融合比例将所述多个LoRA权重数据进行拼接处理或切分处理,生成LoRA融合权重;大语言模型的推理系统获取输入数据;基于所述输入数据调用所述LoRA融合权重进行推理计算。本申请涉及的用于大语言模型推理系统的LoRA权重融合方法及装置,适用于需要动态多风格融合的场景,能够提到显存利用率,满足大语言模型推理系统对灵活性和性能的双重需求。
技术关键词
推理系统
大语言模型
融合方法
融合装置
数据模块
管理方法
输入模块
风格
矩阵
场景
动态
系统为您推荐了相关专利信息
大语言模型
子模块
预训练语言模型
知识检索系统
系统资源监控
大语言模型
残差矩阵
非易失性计算机可读存储介质
K均值聚类算法
线性