基于参数融合与解耦的大语言模型模态扩展方法及装置

正文

推荐专利

申请号：CN202510582920

申请日期：2025-05-07

公开号：CN120105352B

公开日期：2025-07-11

类型：发明专利

摘要

本发明提供一种基于参数融合与解耦的大语言模型模态扩展方法及装置，涉及大语言模型技术领域。该方法包括：通过对预训练语言模型进行微调得到多个多模态大语言模型；对每个多模态大语言模型进行任务向量提取；采用稀疏化策略对原始任务向量进行稀疏，得到稀疏向量，对稀疏向量进行融合，得到融合任务向量；根据融合任务向量构建模型参数；根据融合任务向量对每个多模态大语言模型构造模态专属的二值掩码；根据模型参数以及二值掩码构建融合模型。本发明提出了一种具备无训练融合、模态解耦、性能保留与持续扩展能力的多模态语言模型扩展方法，适用于高效整合多个MLLM、重建原始模型结构、以及应对新任务持续集成等应用场景。

技术关键词

大语言模型多模态参数计算机可读取存储介质预训练语言模型计算机可读指令模型扩展方法扩展设备掩码矩阵扩展装置符号策略编码器处理器输出模块文本音频存储器

系统为您推荐了相关专利信息

基于统一多模态的开放词汇三维场景理解方法

场景理解方法三维点云数据特征提取模块多模态实例分割

多模态多光子透射反射乳腺光谱成像及形态成像方法

乳腺光谱成像成像方法血红蛋白血管

一种简历匹配方法、装置、设备以及存储介质

简历匹配方法剪枝模型模型压缩深度学习模型匹配误差

一种基于高频信号注入的无刷电机起动控制方法及系统

无刷电机起动控制方法电机转子电流值滤波

一种基于时延估计的2R1T运动冗余并联机器人高性能分层同步控制器设计方法

同步控制器时延估计技术同步误差冗余电机转动惯量

基于参数融合与解耦的大语言模型模态扩展方法及装置

站点导航

APP 下载