一种基于知识蒸馏的视频问答模型及多模态知识蒸馏方法

正文

推荐专利

申请号：CN202410728659

申请日期：2024-06-06

公开号：CN118643185A

公开日期：2024-09-13

类型：发明专利

摘要

本发明提供一种基于知识蒸馏的视频问答模型及多模态知识蒸馏方法，基于知识蒸馏的视频问答模型为多模态知识蒸馏架构。知识蒸馏的机制目前来主要应用于模型的压缩方面。该机制首先训练一个超大型的教师模型，其通过大量的参数学习来达到更好的效果。之后通过构建一个轻量级的学生模型，其不仅学习训练集真实标签的知识，同时还学习大型的教师模型训练后所蒸馏出来的知识，以更小的参数体量来逼近大型的教师模型的预测效果，达到模型压缩的目的。

技术关键词

知识蒸馏方法动作特征问答模型语义特征嵌入特征视频动作融合教师融合特征线性注意力机制生成答案模块卷积神经网络结构神经网络模型融合视觉特征

系统为您推荐了相关专利信息

造影图像血管分支识别方法、装置、设备及介质

多层次特征分支识别方法查询特征 X射线造影图像像素

一种基于多模态数据融合的巡店督导方法和系统

多模态数据融合音频特征多模态数据采集督导方法语义特征

一种基于大数据的法规适用性监测方法及系统

特征提取模型组织原型聚类监测方法

情感分析模型构建方法、文本情感分析方法及相关设备

情感分析模型语义特征情感特征文本情感分析方法数据

音频降噪方法、装置、电子设备和存储介质

多模态语义特征音频降噪方法音频特征数据

一种基于知识蒸馏的视频问答模型及多模态知识蒸馏方法

站点导航

APP 下载