联合RGB外观、骨骼姿态与音频信息的多模态视频异常检测方法及相关设备

AITNT
正文
推荐专利
联合RGB外观、骨骼姿态与音频信息的多模态视频异常检测方法及相关设备
申请号:CN202411077123
申请日期:2024-08-07
公开号:CN119007288A
公开日期:2024-11-22
类型:发明专利
摘要
本发明提供一种联合RGB外观、骨骼姿态与音频信息的多模态视频异常检测方法及相关设备。该方法包括:将目标视频分割为若干个视频片段;对每个视频片段进行预处理以获取每个视频片段的多模态数据,所述多模态数据包括人体骨骼轨迹、外观关键区域和声音频谱图;利用骨骼姿态子网络、RGB外观子网络和音频信息子网络分别对每个视频片段的多模态数据进行特征提取,得到每个视频片段的骨骼姿态特征、外观特征和音频特征;采用自适应多流融合策略对每个视频片段的骨骼姿态特征、外观特征和音频特征进行融合并预测每个视频片段的异常分数;若视频片段的异常分数超过设定阈值,则认为所述视频片段包含异常行为。
技术关键词
视频异常检测方法 姿态特征 音频特征 人体骨骼 融合策略 人体骨架 关键点 人体姿态估计算法 非暂态计算机可读存储介质 多模态 短时傅里叶变换 异常检测装置 生成对抗网络 轨迹 视频帧 样本
系统为您推荐了相关专利信息
1
基于语音输入的个性化全身动作生成方法
动作生成方法 音频特征 头部模型 节奏特征 人体模型
2
一种基于多频率自适应调节的水质智能预测方法及系统
多源异构数据 智能预测方法 频率 水质 矩阵
3
一种烧结矿质量多模态分析方法
烧结矿 分析方法 多模态特征融合 数据 深度学习框架
4
一种基于人工智能的图像识别与处理系统及方法
智能识别模块 多模型融合策略 特征提取模块 数据采集模块 卷积神经网络模型
5
校园体育项目测试分析的自动化成绩记录和标准化动作评估方法及系统
体育项目测试 动作评估方法 成绩 平板设备 人体骨骼关键点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号