摘要
本发明提供一种基于知识蒸馏的视频问答模型及多模态知识蒸馏方法,基于知识蒸馏的视频问答模型为多模态知识蒸馏架构。知识蒸馏的机制目前来主要应用于模型的压缩方面。该机制首先训练一个超大型的教师模型,其通过大量的参数学习来达到更好的效果。之后通过构建一个轻量级的学生模型,其不仅学习训练集真实标签的知识,同时还学习大型的教师模型训练后所蒸馏出来的知识,以更小的参数体量来逼近大型的教师模型的预测效果,达到模型压缩的目的。
技术关键词
知识蒸馏方法
动作特征
问答模型
语义特征
嵌入特征
视频
动作融合
教师
融合特征
线性
注意力机制
生成答案
模块
卷积神经网络结构
神经网络模型
融合视觉特征
系统为您推荐了相关专利信息
多层次特征
分支识别方法
查询特征
X射线造影图像
像素
多模态数据融合
音频特征
多模态数据采集
督导方法
语义特征
情感分析模型
语义特征
情感特征
文本情感分析方法
数据