摘要
本发明提供一种基于高斯判别分析的多模态模型微调方法及装置,方法包括:获取训练图像,其中,训练图像包括对应的类别标签;通过视觉编码器对训练图像进行编码处理,得到训练图像的视觉特征;基于视觉特征确定每个类别标签的类别均值向量,并根据类别均值向量确定对应类别标签的协方差逆矩阵;对协方差逆矩阵进行高斯判别分析处理,得到视觉编码器对应的视觉分类器;将视觉分类器与文本编码器对应的文本分类器进行加权集成,得到多模态模型的最终分类器,其中,最终分类器用于识别多个类别标签。通过本申请,能够在无须训练多模态模型的情况下,提高多模态模型在下游任务上的性能。
技术关键词
微调方法
视觉特征
文本分类器
文本编码器
多模态
标签
测试视觉
图像
非暂态计算机可读存储介质
协方差矩阵
处理器
计算机程序产品
微调装置
集成模块
编码模块
参数
系统为您推荐了相关专利信息
状态识别方法
多模态
可见光
点云特征
电力系统继电保护检测技术
运动数据分析方法
骑行眼镜
生成时间序列数据
卷积神经网络模块
长短期记忆网络
多模态生理
注意力
评估系统
单应性变换矩阵
注视点