基于混合专家的多领域多模态大模型连续学习方法及装置

AITNT
正文
推荐专利
基于混合专家的多领域多模态大模型连续学习方法及装置
申请号:CN202510754189
申请日期:2025-06-06
公开号:CN120654735A
公开日期:2025-09-16
类型:发明专利
摘要
本申请的实施例提供了一种基于混合专家的多领域多模态大模型连续学习方法及装置。该方法包括:当需对新领域知识进行学习时,冻结当前多模态大模型的现有参数,并在其大语言模型的每个前馈神经网络子层中新增一个稀疏混合专家模块,以用于所述新领域知识的学习;根据新增的所述稀疏混合专家模块中各专家的参数,生成一虚拟专家;在新增的稀疏混合专家模块的训练过程中,针对每一训练指令,利用所述虚拟专家并配合一投影器计算一自回归损失,以根据所述自回归损失确保每个专家都能充分学习全部指令词。本申请实施例的技术方案可以在避免灾难性遗忘的同时提升多领域学习能力的连续学习方法,以支持多模态大模型在动态开放环境下的高效适应与扩展。
技术关键词
连续学习方法 多模态 前馈神经网络 投影器 模块 指令 参数 学习装置 路由器 处理器 存储装置 电子设备 程序 计算机 动态 介质
系统为您推荐了相关专利信息
1
一种基于VMD的Transformer模型和BiGRU相结合的故障检测方法
故障检测方法 前馈神经网络 电力系统故障诊断 电容式电压互感器 信号
2
语音识别信息显示方法、装置及电子设备
音频 关键词 声纹特征 语音识别功能 信息显示方法
3
一种基于深度学习的手势识别智能护理床系统和控制方法
智能护理床系统 深度学习模型 手势 下位机 护理床床体
4
大模型评价方法、系统、设备、存储介质及程序产品
模型评价方法 指标 文本 情绪特征 非暂态计算机可读存储介质
5
一种机场自适应气候的目标检测系统及其设计方法
检测系统设计方法 图像增强算法 图像处理模块 天气图像处理 机场场面
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号