一种基于知识蒸馏的视频问答模型及多模态知识蒸馏方法

AITNT
正文
推荐专利
一种基于知识蒸馏的视频问答模型及多模态知识蒸馏方法
申请号:CN202410728659
申请日期:2024-06-06
公开号:CN118643185A
公开日期:2024-09-13
类型:发明专利
摘要
本发明提供一种基于知识蒸馏的视频问答模型及多模态知识蒸馏方法,基于知识蒸馏的视频问答模型为多模态知识蒸馏架构。知识蒸馏的机制目前来主要应用于模型的压缩方面。该机制首先训练一个超大型的教师模型,其通过大量的参数学习来达到更好的效果。之后通过构建一个轻量级的学生模型,其不仅学习训练集真实标签的知识,同时还学习大型的教师模型训练后所蒸馏出来的知识,以更小的参数体量来逼近大型的教师模型的预测效果,达到模型压缩的目的。
技术关键词
知识蒸馏方法 动作特征 问答模型 语义特征 嵌入特征 视频 动作融合 教师 融合特征 线性 注意力机制 生成答案 模块 卷积神经网络结构 神经网络模型 融合视觉特征
系统为您推荐了相关专利信息
1
造影图像血管分支识别方法、装置、设备及介质
多层次特征 分支识别方法 查询特征 X射线造影图像 像素
2
一种基于多模态数据融合的巡店督导方法和系统
多模态数据融合 音频特征 多模态数据采集 督导方法 语义特征
3
一种基于大数据的法规适用性监测方法及系统
特征提取模型 组织 原型 聚类 监测方法
4
情感分析模型构建方法、文本情感分析方法及相关设备
情感分析模型 语义特征 情感特征 文本情感分析方法 数据
5
音频降噪方法、装置、电子设备和存储介质
多模态 语义特征 音频降噪方法 音频特征 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号