一种基于LoRA-MoE的大模型微调方法、系统、设备及介质

正文

推荐专利

申请号：CN202411682148

申请日期：2024-11-22

公开号：CN119622332A

公开日期：2025-03-14

类型：发明专利

摘要

本发明涉及人工智能技术领域，具体地说，涉及一种基于LoRA‑MoE的大模型微调方法、系统、设备及介质；该方法利用LoRA技术能够使用更小的参数对大模型进行微调的特性与MoE架构能使得模型泛化能力更强以及效果更好的特性相结合，提出了采用LoRA‑MoE技术对大模型进行微调，这种方法可以解决大模型微调时需要消耗大量显存的问题以及使用LoRA技术微调时效果较差的问题，确保了大模型在微调过程中能够减小消耗并保证一定的微调效果。

技术关键词

微调方法适配器自然语言矩阵微调单元电子设备上执行采集单元微调系统可读存储介质参数人工智能技术计算机数据模块存储器处理器线性指令

系统为您推荐了相关专利信息

一种基于边缘检测的LED球幕显示插值方法

边缘检测决策对比度像素点矩阵

基于数字孪生的驱动能效与安全虚实融合闭环管理方法

闭环管理方法数字孪生模型仿真模型设备运行状态多源异构数据

基于交互式大模型Agent的配电网规划报告生成方法及装置

配电网规划报告生成方法自然语言理解模型数据库表结构报告生成装置

用于病毒基因变异检测的多序列比对方法

序列比对方法连续性多序列比对算法因子变异检测技术

一种基于循环矩阵的抗侧信道攻击掩码防护方法及系统

掩码防护方法生成随机掩码矩阵加密算法信道

一种基于LoRA-MoE的大模型微调方法、系统、设备及介质

站点导航

APP 下载