基于膨胀3D卷积网络和Transformer的双流门控暴力检测方法及系统

AITNT
正文
推荐专利
基于膨胀3D卷积网络和Transformer的双流门控暴力检测方法及系统
申请号:CN202510035710
申请日期:2025-01-09
公开号:CN119942407A
公开日期:2025-05-06
类型:发明专利
摘要
本发明基于膨胀3D卷积网络和Transformer的双流门控暴力检测方法及系统,通过以下步骤实现分类;S1:获取视频流,将视频流分割成帧,计算视频流连续帧之间的稠密光流;S2:通过滑动窗口分割视频流片段,利用光流模态抑制RGB模态中的非运动元素;S3:通过3D卷积神经网络对稠密光流和SRGB模态进行时空建模,并进行特征融合,创建特征图;S4:通过Transformer编码器对视频流片段的时空特征序列进行时间建模,生成时间特征图;S5:通过1D卷积神经网络进行平均池化,并通过多层感知机进行分类,将视频分类为暴力或非暴力。本发明解决了暴力检测模型在处理时空特征时的不足,提升了暴力检测的准确性与效率,尤其在动态视频监控场景下的应用效果。
技术关键词
稠密光流 多层感知机 视频流 注意力机制 滑动窗口方法 模块 暴力检测系统 动态视频监控 元素 序列 数据 神经网络架构 编码器结构 视频帧 模态特征
系统为您推荐了相关专利信息
1
一种用于作物病害检测的动态自适应注意力跨域小样本图像分类方法
作物病害检测 图像分类方法 图像分类模型 预训练模型 正则化技术
2
一种用于处理视频的方法和电子设备
数据压缩格式 图像 电子设备 芯片系统 视频流
3
基于卷积神经网络和残差注意力机制的蛋白质表达预测方法
残差注意力机制 蛋白质表达 神经网络训练 多头注意力机制 DNA序列
4
一种融合信号解混与多任务学习的鲜食玉米品质检测方法
鲜食玉米品质 玉米籽粒品质 组织 注意力机制 神经网络模型训练
5
一种综合影像学指标、呼出气VOCs数据的肺小结节恶性风险预测模型的建立方法
风险预测模型 呼出气 深度学习模型 图像分析软件 指标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号