摘要
本发明提供了一种用于视频分类的方法、装置及设备,其方法包括:获取待处理视频的视频特征;将待处理视频划分成若干个视频片段;对每个视频片段的每帧视频图像进行特征提取,将得到的视频片段的每帧视频图像的特征向量进行相加,得到视频片段对应的特征向量,基于每个视频片段的特征向量,得到待处理视频的视觉特征;获取待处理视频的点云数据,基于点云数据,确定待处理视频的点云特征;基于视频特征、视觉特征和点云特征,确定第一融合特征,输入训练好的LSTM模型,将输出与视觉特征融合,再与点云特征融合,得到第二融合特征;进行池化处理后输入训练好的MLP模型,确定待处理视频的视频类别。本发明识别准确率高,而且资源占用相对少、效率较高。
技术关键词
视频
视觉特征
融合特征
点云特征
LSTM模型
计算机可读指令
时序特征
图像
数据
模块
像素
处理器
通道
文本
矩阵
存储器
介质
资源