摘要
本发明涉及人工智能技术领域,具体地说,涉及一种基于LoRA‑MoE的大模型微调方法、系统、设备及介质;该方法利用LoRA技术能够使用更小的参数对大模型进行微调的特性与MoE架构能使得模型泛化能力更强以及效果更好的特性相结合,提出了采用LoRA‑MoE技术对大模型进行微调,这种方法可以解决大模型微调时需要消耗大量显存的问题以及使用LoRA技术微调时效果较差的问题,确保了大模型在微调过程中能够减小消耗并保证一定的微调效果。
技术关键词
微调方法
适配器
自然语言
矩阵
微调单元
电子设备上执行
采集单元
微调系统
可读存储介质
参数
人工智能技术
计算机
数据
模块
存储器
处理器
线性
指令
系统为您推荐了相关专利信息
闭环管理方法
数字孪生模型
仿真模型
设备运行状态
多源异构数据
配电网规划
报告生成方法
自然语言理解模型
数据库表结构
报告生成装置
序列比对方法
连续性
多序列比对算法
因子
变异检测技术