一种音视频联合的事件检测方法

正文

推荐专利

一种音视频联合的事件检测方法

申请号：CN202410712802

申请日期：2024-06-04

公开号：CN118626926A

公开日期：2024-09-10

类型：发明专利

摘要

本发明涉及一种音视频联合的事件检测方法，包括以下步骤：获取目标音视频，所述目标音视频包含若干连续的音视频片段；利用音视频检测模型分析所述目标音视频获得事件分类结果：所述音视频检测模型通过弱监督学习进行优化，并通过以下步骤来去除标签噪声：获取辅助音视频，所述辅助音视频包含与所述目标音视频不相关的事件类别；通过交换所述目标音视频和所述辅助音视频的音频模态或视觉模态生成对抗性样本；利用置信度预测模型分析获得所述目标音视频和所述对抗性样本的事件类别和事件置信度；根据所述目标音视频和所述对抗性样本的事件类别和事件置信度来去除标签噪声。本发明能够提高事件检测的准确性。

技术关键词

音视频视觉特征音频特征对抗性事件检测方法弱监督学习融合特征样本特征提取模块对齐模块多实例跨模态标签噪声多模态注意力机制

系统为您推荐了相关专利信息

语音驱动人脸视频生成方法、系统、存储介质和电子设备

视频生成方法语音生成对抗模型视频生成系统采样点

显示设备及音频数据处理方法

蓝牙模块蓝牙设备显示设备音频数据处理方法指令

一种基于错误归因的多模态推理方法及推理系统

检查点推理方法矩阵归因文本

基于深度学习的图像异常篡改自动检测方法、存储介质及设备

自动检测方法建立检测模型关键帧提取算法全局平均池化图像篡改检测

一种监控系统及其监控方法

多媒体接口多路解码器移动行业处理器接口网络加速器音视频

一种音视频联合的事件检测方法

站点导航

APP 下载