摘要
本发明公开了一种基于基因学习模型的曲艺视频标注方法,本方法包括以下步骤:S1、提取视频的关键帧,记录关键帧在曲艺视频所有帧中的下标,计算当前关键帧的时间,并将关键帧输入特征提取网络进行特征提取;S2、分离曲艺视频的音频,提取音频特征;S3、将每个关键帧的视觉特征以及音频特征进行同步聚合,得到每帧的多模态融合特征,对所有关键帧的多模态融合特征进行时序聚合,得到视频级时序聚合特征;S4、根据得到的视频级时序聚合特征进行推理,得到视频级特征,根据得到的关键帧特征进行推理得到视频帧级特征;本发明可以实现对传统曲艺视频的多粒度标注,有助于后续对该视频的管理、检索,有利于传播中华文化。
技术关键词
视频标注方法
音频特征提取
融合特征
特征提取网络
视觉特征
基因
时序
代表
关键帧提取技术
视频关键帧提取
多模态
Gabor滤波器
图像
视频帧
特征提取算法
通道
系统为您推荐了相关专利信息
关键特征点
面部
多模态图像配准
特征提取网络
深度神经网络
车道线检测方法
融合特征
分类网络
多尺度特征融合
层级
标签生成方法
贝叶斯网络模型
神经网络模型
融合特征
推理规则
解调方法
分类网络训练
并行神经网络
散斑图像
特征提取模块