摘要
本发明公开了一种基于三维卷积神经网络的暴力视频检测模型,包括数据获取处理模块:用于获取并处理视频数据,处理后的视频数据为五维数组,维度包括批次、视频帧数、高度、宽度和通道数;3D卷积层,用于在堆叠的视频数据的相邻帧组成的立方体上应用三维内核从相邻帧中提取视频数据的特征,包括时空特征;3D最大池化层,用于降低特征映射的空间和时间维度;批归一化层,用于加速模型训练和提高模型稳定性;Flatten层,用于将多维特征映射以方阵的形式转换为一维向量;Dense层,用于对Flatten模块输出的一维向量分类,得到最终的分类类别,分类类别包括暴力和非暴力,经过检测本模型计算的总体精度可达80.58%。
技术关键词
三维卷积神经网络
视频
加速模型训练
立方体
双曲正切函数
内核
线性单元
模块
大数据
训练集
非线性
过滤器
通道
指标
图像
精度
系统为您推荐了相关专利信息
压缩算法
动态压缩方法
加密数据
数据类型信息
策略
图片
计算机可读指令
特征提取模型
视频
神经网络单元
视频编辑方法
文本
视频帧
Softmax函数
视频编辑技术