基于混合专家的多领域多模态大模型连续学习方法及装置

正文

推荐专利

申请号：CN202510754189

申请日期：2025-06-06

公开号：CN120654735A

公开日期：2025-09-16

类型：发明专利

摘要

本申请的实施例提供了一种基于混合专家的多领域多模态大模型连续学习方法及装置。该方法包括：当需对新领域知识进行学习时，冻结当前多模态大模型的现有参数，并在其大语言模型的每个前馈神经网络子层中新增一个稀疏混合专家模块，以用于所述新领域知识的学习；根据新增的所述稀疏混合专家模块中各专家的参数，生成一虚拟专家；在新增的稀疏混合专家模块的训练过程中，针对每一训练指令，利用所述虚拟专家并配合一投影器计算一自回归损失，以根据所述自回归损失确保每个专家都能充分学习全部指令词。本申请实施例的技术方案可以在避免灾难性遗忘的同时提升多领域学习能力的连续学习方法，以支持多模态大模型在动态开放环境下的高效适应与扩展。

技术关键词

连续学习方法多模态前馈神经网络投影器模块指令参数学习装置路由器处理器存储装置电子设备程序计算机动态介质

系统为您推荐了相关专利信息

一种基于VMD的Transformer模型和BiGRU相结合的故障检测方法

故障检测方法前馈神经网络电力系统故障诊断电容式电压互感器信号

语音识别信息显示方法、装置及电子设备

音频关键词声纹特征语音识别功能信息显示方法

一种基于深度学习的手势识别智能护理床系统和控制方法

智能护理床系统深度学习模型手势下位机护理床床体

大模型评价方法、系统、设备、存储介质及程序产品

模型评价方法指标文本情绪特征非暂态计算机可读存储介质

一种机场自适应气候的目标检测系统及其设计方法

检测系统设计方法图像增强算法图像处理模块天气图像处理机场场面

基于混合专家的多领域多模态大模型连续学习方法及装置

站点导航

APP 下载