摘要
本发明基于膨胀3D卷积网络和Transformer的双流门控暴力检测方法及系统,通过以下步骤实现分类;S1:获取视频流,将视频流分割成帧,计算视频流连续帧之间的稠密光流;S2:通过滑动窗口分割视频流片段,利用光流模态抑制RGB模态中的非运动元素;S3:通过3D卷积神经网络对稠密光流和SRGB模态进行时空建模,并进行特征融合,创建特征图;S4:通过Transformer编码器对视频流片段的时空特征序列进行时间建模,生成时间特征图;S5:通过1D卷积神经网络进行平均池化,并通过多层感知机进行分类,将视频分类为暴力或非暴力。本发明解决了暴力检测模型在处理时空特征时的不足,提升了暴力检测的准确性与效率,尤其在动态视频监控场景下的应用效果。
技术关键词
稠密光流
多层感知机
视频流
注意力机制
滑动窗口方法
模块
暴力检测系统
动态视频监控
元素
序列
数据
神经网络架构
编码器结构
视频帧
模态特征
系统为您推荐了相关专利信息
作物病害检测
图像分类方法
图像分类模型
预训练模型
正则化技术
残差注意力机制
蛋白质表达
神经网络训练
多头注意力机制
DNA序列
鲜食玉米品质
玉米籽粒品质
组织
注意力机制
神经网络模型训练
风险预测模型
呼出气
深度学习模型
图像分析软件
指标