摘要
本申请公开了一种视频理解方法、模型训练方法、装置以及电子设备,该方法用于通过训练好的视频理解模型进行视频任务理解,以输出视频理解结果;其中,视频理解模型是基于超网络构建的,其包括数据编码神经元模块、记忆神经元模块以及任务神经元模块;该方法包括获取待理解视频;通过数据编码神经元模块对待理解视频中的各模态数据进行编码,以获取各模态编码数据;通过记忆神经元模块对各模态编码数据进行特征提取,以获取各模态特征数据;将各模态编码数据以及各模态特征数据共同输入任务神经元模块,以输出视频理解结果。本申请采用了一种基于超网络构建的视频理解模型处理视频理解任务,这种网络结构能够提高模型性能,具有更强的泛化能力。
技术关键词
模态特征
模型训练方法
视频理解方法
记忆
数据编码
模块
超网络
融合特征
样本
电子设备
标签
网络结构
多模态信息
参数
文本
存储器
处理器
系统为您推荐了相关专利信息
灾害风险预警方法
多维特征向量
配电系统
深度强化学习算法
特征提取模型
轻量化活塞
改进型模拟退火算法
薄膜传感器阵列
内燃机活塞技术
脉冲激光沉积技术
水利水电工程施工
安全监管系统
安全监管方法
动态知识图谱
风险
控温方法
分布式传感器网络
优化控制策略
门窗
长短期记忆网络
识别模型训练方法
信号
短时傅里叶变换
强度
频率