基于双录场景的违规行为检测方法、装置及计算机设备

正文

推荐专利

申请号：CN202411029321

申请日期：2024-07-29

公开号：CN118965069A

公开日期：2024-11-15

类型：发明专利

摘要

本申请实施例属于人工智能领域，涉及一种基于双录场景的违规行为检测方法，包括：获取待检测的音视频；将音视频输入双录违规检测模型中的多模态特征提取网络，以提取音视频的多模态特征，多模态特征包括音视频的视频特征和音频特征；将多模态特征输入双录违规检测模型中的音频分离网络，得到音视频中各说话人的音频；基于各说话人的音频，通过多模态特征提取网络在各说话人中确定关键说话人，并确定关键说话人的音频；将多模态特征和关键说话人的音频输入双录违规检测模型中的违规检测网络，以进行旁人指导违规检测，得到音视频的违规检测结果。本申请解决了双录场景中旁人指导违规行为检测准确性较低的问题。

技术关键词

违规检测模型多模态特征音视频特征提取网络音频特征计算机可读指令场景声纹特征编码特征计算机设备同步性可读存储介质发声特征提取模块样本

系统为您推荐了相关专利信息

角磨机智能集成控制系统及方法

角磨机智能集成控制系统特征提取单元水流特征集成控制方法

基于Mamba的光学引导的合成孔径雷达图像超分辨率重建方法及系统

合成孔径雷达图像多模态特征融合超分辨率重建方法重建高分辨率图像融合特征

一种基于风格向量的语音驱动数字人面部视频生成方法

视频生成方法视频编码风格音频特征音频编码器

一种舰船分类方法、装置、设备及系统

检测分类模型分类方法机载雷达特征提取网络人机交互界面显示

一种多频段无线电信号异常干扰检测方法及系统

干扰检测方法小波阈值去噪算法多频段异常信号异常状态

基于双录场景的违规行为检测方法、装置及计算机设备

站点导航

APP 下载