摘要
本发明公开了一种基于多模态的安防预警方法及系统,涉及行为识别的技术领域。通过获取目标区域的音视频数据,并对音视频数据进行预处理,得到视频特征数据和音频特征数据;将视频特征数据作为预训练的行为识别模型的输入,得到第一检测结果;将音频特征数据作为预训练的语音识别模型的输入,得到第二检测结果;若第一检测结果为异常或第二检测结果为异常,则生成预警信息,提示工作人员关注该区域情况。通过自动化地分析音视频数据,能够迅速筛选出异常行为,避免了人工监控可能的疏忽;并通过预警信息提示工作人员及时处理,避免安全事件进一步恶化,大大缩短了响应时间,提高了事件处理的及时性,提高了安防系统的整体效率。
技术关键词
视频特征数据
音频特征数据
安防预警方法
瓶颈结构
安防预警系统
注意力
多模态
音视频
语音识别模型
分支
时序
伽马校正
视频识别
音频识别模块
数据获取模块
通道
安防系统
系统为您推荐了相关专利信息
训练数据处理方法
矩阵
音频特征数据
英语
数据分类
多尺度特征融合
缺陷评价方法
多角度
生成多尺度
线性单元
视频流
视频特征数据
人脸识别方法
判断人脸
关键点
农田障碍物检测
可变形卷积网络
输出特征
YOLO模型
收割机