摘要
本发明公开了一种多模态预训练模型的迁移方法和相关产品。该方法中,为视觉编码器中每一个Transformer编码器模块的每一个注意力头的映射矩阵分配独立的低秩微调项,每一个低秩微调项为独立的A矩阵与独立的B矩阵的乘积,并且为视觉编码器中每一个Transformer编码器模块的每一个注意力头分配独立的门控参数,Transformer编码器模块的输出是根据其自身的各注意力头的输出特征及各注意力头对应的门控参数确定的,门控参数用于调节对应注意力头的权重;将训练样本的文本特征和图像特征输入至输出模块,得到分类损失,根据分类损失对各A矩阵、各B矩阵以及各门控参数进行迭代。该方法提高模型迁移到下游任务上的精度且提高收敛速度。
技术关键词
编码器模块
预训练模型
迁移方法
多模态
文本编码器
注意力机制
矩阵
参数
输出特征
存储器存储指令
输入输出模块
网络结构
图像处理模块
处理器
样本
计算机设备
系统为您推荐了相关专利信息
多模态影像数据
图像嵌入
注意力机制
三维模型
文本
电力负荷预测方法
多模态交互
负荷预测模型
多源异构数据
归因
智能问诊方法
智能问诊系统
同义词
声音采集器
术语