基于多摄像头的三维重建后的音视频的暴力事件检测方法

正文

推荐专利

申请号：CN202510702113

申请日期：2025-05-28

公开号：CN120343208A

公开日期：2025-07-18

类型：发明专利

摘要

本发明提供一种基于多摄像头的三维重建后的音视频的暴力事件检测方法，由于现有方法在处理遮挡、背对施暴等情况时存在错检误检的问题，在音频识别上没有声纹识别方法，容易声音混淆，所以采取三维重建与声纹识别的方法。在本方法中三维重建利用多摄像头获取人体关键点数据，结合处理后的图卷积网络（GCN）和二维卷积神经网络（2DCNN）分别处理视频和音频数据，来进行多维度的暴力检测，然后根据梅尔频谱特性去区别不同人的声纹特性，提高检测精度。然后在视频与音频的概率设置权重中我们需要自适应调整权重，并且通过算法优化阈值并判定暴力行为。这种创新方法对于以往的单摄像头检测或者无声纹检测方法具有优异的超越性。

技术关键词

暴力事件检测方法二维卷积神经网络音频音视频摄像头坐标系人体关键点卷积网络模型数据关键点检测算法节点特征手部关键点矩阵误差校正纹检测方法速度计算方法人体骨骼频谱特征

系统为您推荐了相关专利信息

一种基于数字文化领域大数据模型的部署方法和应用终端

注意力机制算法数据语音识别分析查询方法特征提取方法

基于AI大模型的个人声纹识别及环境噪音过滤系统

深度学习模型过滤系统个性化特征声纹特征高斯滤波器

钻孔攻牙机故障识别方法和装置

钻孔攻牙机故障识别方法识别神经网络振动传感器二维卷积神经网络

基于形象克隆的数字人实时对话方法、系统、终端及介质

人脸图像序列对话方法人脸检测算法 WebRTC技术视频同步

基于协同注意力机制的视听显著性预测方法与系统

高层视觉特征显著性预测方法融合特征协同注意力视听

基于多摄像头的三维重建后的音视频的暴力事件检测方法

站点导航

APP 下载