摘要
本公开提供了一种模型训练方法、装置、设备及介质,该方法包括:将多模态数据输入至学生模型,得到多模态特征和第一输出结果,多模态特征包括图像模态特征、语音模态特征和文本模态特征中至少一个;将多模态特征输入至教师模型,对多模态特征进行特征编码得到多个特征向量以及每个特征向量的置信度;基于置信度和特征向量,生成第二输出结果;基于第一输出结果以及第二输出结果确定蒸馏损失;从教师模型的中间层和学生模型的中间层获取中间结果以确定中层损失;基于蒸馏损失和中层损失更新学生模型的参数。
技术关键词
多模态特征
中间层
学生
教师
模型训练方法
蒸馏
矩阵
模型训练装置
编码
输入模块
处理器
注意力机制
文本
语音
校准器
参数
存储装置
可读存储介质
系统为您推荐了相关专利信息
知识图谱推理
绘画
心理分析系统
阴影特征
径向基核函数
代码注释生成方法
知识蒸馏技术
低资源语言
教师
标签
预测输出值
时序金融数据
教师
学生
神经网络模型
企业
电力数据分析方法
多模态特征融合
文本
聚类