一种基于LoRA-MoE的大模型微调方法、系统、设备及介质

AITNT
正文
推荐专利
一种基于LoRA-MoE的大模型微调方法、系统、设备及介质
申请号:CN202411682148
申请日期:2024-11-22
公开号:CN119622332A
公开日期:2025-03-14
类型:发明专利
摘要
本发明涉及人工智能技术领域,具体地说,涉及一种基于LoRA‑MoE的大模型微调方法、系统、设备及介质;该方法利用LoRA技术能够使用更小的参数对大模型进行微调的特性与MoE架构能使得模型泛化能力更强以及效果更好的特性相结合,提出了采用LoRA‑MoE技术对大模型进行微调,这种方法可以解决大模型微调时需要消耗大量显存的问题以及使用LoRA技术微调时效果较差的问题,确保了大模型在微调过程中能够减小消耗并保证一定的微调效果。
技术关键词
微调方法 适配器 自然语言 矩阵 微调单元 电子设备上执行 采集单元 微调系统 可读存储介质 参数 人工智能技术 计算机 数据 模块 存储器 处理器 线性 指令
系统为您推荐了相关专利信息
1
一种基于边缘检测的LED球幕显示插值方法
边缘检测 决策 对比度 像素点 矩阵
2
基于数字孪生的驱动能效与安全虚实融合闭环管理方法
闭环管理方法 数字孪生模型 仿真模型 设备运行状态 多源异构数据
3
基于交互式大模型Agent的配电网规划报告生成方法及装置
配电网规划 报告生成方法 自然语言理解模型 数据库表结构 报告生成装置
4
用于病毒基因变异检测的多序列比对方法
序列比对方法 连续性 多序列比对算法 因子 变异检测技术
5
一种基于循环矩阵的抗侧信道攻击掩码防护方法及系统
掩码防护方法 生成随机 掩码矩阵 加密算法 信道
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号