基于参数融合与解耦的大语言模型模态扩展方法及装置

AITNT
正文
推荐专利
基于参数融合与解耦的大语言模型模态扩展方法及装置
申请号:CN202510582920
申请日期:2025-05-07
公开号:CN120105352B
公开日期:2025-07-11
类型:发明专利
摘要
本发明提供一种基于参数融合与解耦的大语言模型模态扩展方法及装置,涉及大语言模型技术领域。该方法包括:通过对预训练语言模型进行微调得到多个多模态大语言模型;对每个多模态大语言模型进行任务向量提取;采用稀疏化策略对原始任务向量进行稀疏,得到稀疏向量,对稀疏向量进行融合,得到融合任务向量;根据融合任务向量构建模型参数;根据融合任务向量对每个多模态大语言模型构造模态专属的二值掩码;根据模型参数以及二值掩码构建融合模型。本发明提出了一种具备无训练融合、模态解耦、性能保留与持续扩展能力的多模态语言模型扩展方法,适用于高效整合多个MLLM、重建原始模型结构、以及应对新任务持续集成等应用场景。
技术关键词
大语言模型 多模态 参数 计算机可读取存储介质 预训练语言模型 计算机可读指令 模型扩展方法 扩展设备 掩码矩阵 扩展装置 符号 策略 编码器 处理器 输出模块 文本 音频 存储器
系统为您推荐了相关专利信息
1
基于统一多模态的开放词汇三维场景理解方法
场景理解方法 三维点云数据 特征提取模块 多模态 实例分割
2
多模态多光子透射反射乳腺光谱成像及形态成像方法
乳腺 光谱成像 成像方法 血红蛋白 血管
3
一种简历匹配方法、装置、设备以及存储介质
简历匹配方法 剪枝模型 模型压缩 深度学习模型 匹配误差
4
一种基于高频信号注入的无刷电机起动控制方法及系统
无刷电机 起动控制方法 电机转子 电流值 滤波
5
一种基于时延估计的2R1T运动冗余并联机器人高性能分层同步控制器设计方法
同步控制器 时延估计技术 同步误差 冗余 电机转动惯量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号