用于大语言模型推理系统的LoRA权重融合方法及装置

正文

推荐专利

申请号：CN202510077239

申请日期：2025-01-17

公开号：CN120354930A

公开日期：2025-07-22

类型：发明专利

摘要

本申请涉及一种用于大语言模型推理系统的LoRA权重融合方法及装置。该方法包括：大语言模型推理系统获取多个LoRA权重数据；确定多个LoRA权重数据对应的融合比例；基于所述融合比例将所述多个LoRA权重数据进行拼接处理或切分处理，生成LoRA融合权重；大语言模型的推理系统获取输入数据；基于所述输入数据调用所述LoRA融合权重进行推理计算。本申请涉及的用于大语言模型推理系统的LoRA权重融合方法及装置，适用于需要动态多风格融合的场景，能够提到显存利用率，满足大语言模型推理系统对灵活性和性能的双重需求。

技术关键词

推理系统大语言模型融合方法融合装置数据模块管理方法输入模块风格矩阵场景动态

系统为您推荐了相关专利信息

一种基于大语言模型的智能判别体优化系统和方法

大语言模型子模块预训练语言模型知识检索系统系统资源监控

大语言模型压缩方法、装置、设备及存储介质

大语言模型残差矩阵非易失性计算机可读存储介质 K均值聚类算法线性

大语言模型的强化学习训练方法、装置、设备及存储介质

学习训练方法文本大语言模型样本数据

一种基于分层级处理架构的重点事件判别方法及系统

文本关键词层次聚类方法判别方法唯一性

一种基于大语言模型的会话响应方法、装置、设备及介质

历史会话大语言模型关键词主题标签

用于大语言模型推理系统的LoRA权重融合方法及装置

站点导航

APP 下载