摘要
本发明提出一种基于模态调和的多模态模型训练方法和装置,包括:获取已标注类别标签的多模态数据,并将其转化为符合模型结构输入的指定形式,得到训练数据。构建包括多个学习器的多模态模型,每个学习器对应一种模态,用于提取对应模态数据的特征,根据各学习器提取的特征进行分类,通过分类结果和该类别标签构建损失函数,依次交替训练每一个模态的学习器,以完成对该多模态模型的训练;将待分类多模态数据输入训练完成后的多模态模型,得到每个学习器的输出特征,融合所有该输出特征,得到该待分类多模态数据的分类结果。
技术关键词
学习器
模型训练方法
输出特征
模型训练装置
随机梯度下降
信息显示设备
多模态
标签
人工智能模型
深度图
语义
电子设备
数据处理模块
算法
参数
图像
系统为您推荐了相关专利信息
视网膜图像分层
计算机可执行指令
模型训练方法
训练集
标签
性能测评方法
宇航通信
训练神经网络
芯片
线性单元
夜间车辆检测方法
蒙特卡洛
双向特征金字塔
检测网络模型
特征提取模块
注意力
特征提取网络
姿态估计
人体骨架
卷积模块