联合RGB外观、骨骼姿态与音频信息的多模态视频异常检测方法及相关设备

正文

推荐专利

申请号：CN202411077123

申请日期：2024-08-07

公开号：CN119007288A

公开日期：2024-11-22

类型：发明专利

摘要

本发明提供一种联合RGB外观、骨骼姿态与音频信息的多模态视频异常检测方法及相关设备。该方法包括：将目标视频分割为若干个视频片段；对每个视频片段进行预处理以获取每个视频片段的多模态数据，所述多模态数据包括人体骨骼轨迹、外观关键区域和声音频谱图；利用骨骼姿态子网络、RGB外观子网络和音频信息子网络分别对每个视频片段的多模态数据进行特征提取，得到每个视频片段的骨骼姿态特征、外观特征和音频特征；采用自适应多流融合策略对每个视频片段的骨骼姿态特征、外观特征和音频特征进行融合并预测每个视频片段的异常分数；若视频片段的异常分数超过设定阈值，则认为所述视频片段包含异常行为。

技术关键词

视频异常检测方法姿态特征音频特征人体骨骼融合策略人体骨架关键点人体姿态估计算法非暂态计算机可读存储介质多模态短时傅里叶变换异常检测装置生成对抗网络轨迹视频帧样本

系统为您推荐了相关专利信息

基于语音输入的个性化全身动作生成方法

动作生成方法音频特征头部模型节奏特征人体模型

一种基于多频率自适应调节的水质智能预测方法及系统

多源异构数据智能预测方法频率水质矩阵

一种烧结矿质量多模态分析方法

烧结矿分析方法多模态特征融合数据深度学习框架

一种基于人工智能的图像识别与处理系统及方法

智能识别模块多模型融合策略特征提取模块数据采集模块卷积神经网络模型

校园体育项目测试分析的自动化成绩记录和标准化动作评估方法及系统

体育项目测试动作评估方法成绩平板设备人体骨骼关键点

联合RGB外观、骨骼姿态与音频信息的多模态视频异常检测方法及相关设备

站点导航

APP 下载