摘要
本发明提供了一种多模态大模型构建方法以及大模型在线更新方法,本发明的技术方案通过从一些既有的预训练模块中拆解出子模块,可以根据需要进行组合以得到新的多模态大模型,以提高开发效率;随后,在对新的多模态大模型进行训练时,对部分参数进行冻结,仅训练少量的其余参数,从而利用原有来自预训练模型的子模块的知识,减少训练开销,进一步提高开发效率;最后,对经训练的多模态大模型进行混合精度量化,以便减少参数量,从而更好地部署到资源受限的设备上。
技术关键词
模型构建方法
在线更新方法
预训练模型
问答语料
语言模块
视觉特征
多模态
图文
子模块
文本
参数
计算机程序产品
处理器
标记
序列
指令
精度
可读存储介质
图像
系统为您推荐了相关专利信息
字符
待测物品
侵权检测方法
图像分类模型
预训练模型
风机叶片
缺陷类别
状态监测方法
MFCC特征
状态监测系统
关系模型构建方法
混合聚类算法
均值漂移算法
数据中心
因子