摘要
本申请实施例提供了一种基于特征融合的视频类别预测方法及相关设备,属于人工智能技术领域。该方法包括:将待预测视频的目标图像数据输入至特征提取模块进行特征提取,得到目标局部特征和目标全局特征。通过特征融合层对局部和全局特征进行融合,得到目标复合特征。获取每一目标图像数据的目标复合特征,得到多个目标复合特征,通过时序池化模块对多个目标复合特征进行时序特征学习,得到复合时序特征。根据复合时序特征对目标图像数据进行类别预测,得到预测目标类别。即对局部和全局的特征进行融合,再对特征融合后的复合时序特征进行时序特征学习,得到复合时序特征,从而基于复合时序特征进行类别预测,提高了视频类别预测的准确性。
技术关键词
类别预测模型
时序特征
类别预测方法
特征提取模块
图像
数据
视频
注意力
人工智能技术
预测装置
电子设备
策略
标签
输入模块
存储器
处理器
关系
参数