用于大语言模型推理系统的LoRA权重融合方法及装置

AITNT
正文
推荐专利
用于大语言模型推理系统的LoRA权重融合方法及装置
申请号:CN202510077239
申请日期:2025-01-17
公开号:CN120354930A
公开日期:2025-07-22
类型:发明专利
摘要
本申请涉及一种用于大语言模型推理系统的LoRA权重融合方法及装置。该方法包括:大语言模型推理系统获取多个LoRA权重数据;确定多个LoRA权重数据对应的融合比例;基于所述融合比例将所述多个LoRA权重数据进行拼接处理或切分处理,生成LoRA融合权重;大语言模型的推理系统获取输入数据;基于所述输入数据调用所述LoRA融合权重进行推理计算。本申请涉及的用于大语言模型推理系统的LoRA权重融合方法及装置,适用于需要动态多风格融合的场景,能够提到显存利用率,满足大语言模型推理系统对灵活性和性能的双重需求。
技术关键词
推理系统 大语言模型 融合方法 融合装置 数据模块 管理方法 输入模块 风格 矩阵 场景 动态
系统为您推荐了相关专利信息
1
一种基于大语言模型的智能判别体优化系统和方法
大语言模型 子模块 预训练语言模型 知识检索系统 系统资源监控
2
大语言模型压缩方法、装置、设备及存储介质
大语言模型 残差矩阵 非易失性计算机可读存储介质 K均值聚类算法 线性
3
大语言模型的强化学习训练方法、装置、设备及存储介质
学习训练方法 文本 大语言模型 样本 数据
4
一种基于分层级处理架构的重点事件判别方法及系统
文本 关键词 层次聚类方法 判别方法 唯一性
5
一种基于大语言模型的会话响应方法、装置、设备及介质
历史会话 大语言模型 关键词 主题 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号