音视频多模态联合鉴伪方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202410962589

申请日期：2024-07-18

公开号：CN118711621A

公开日期：2024-09-27

类型：发明专利

摘要

本申请提供了音视频多模态联合鉴伪方法、装置、电子设备及存储介质，包括：对音频信息进行语音活动检测处理得到多个语音活动音频，再对多个语音活动音频依次进行音频特征提取、音频片段起终点检测以及唇动生成，确定出音频表征向量、活动音频起终点序列以及语音驱动生成的唇动序列；对图像信息进行唇动检测、唇动起终点检测以及人脸特征提取，确定出人脸唇动序列、唇动活动起终点序列以及人脸表征向量；对音频表征向量、活动音频起终点序列、语音驱动生成的唇动序列、人脸唇动序列、唇动活动起终点序列以及人脸表征向量进行一致性检测融合处理，确定出目标视频的真伪类别，从而实现了利用双模态信息间的相关性进行鉴伪工作提升了鉴伪算法的性能。

技术关键词

鉴伪方法序列人脸表征终点音视频多模态语音活动检测一致性检测音频特征提取人脸特征提取鉴伪装置机器可读指令边界检测方法电子设备图像处理模块

系统为您推荐了相关专利信息

一种iPS前体细胞智能捕获与识别方法、装置、电子设备及存储介质

预测分类模型体细胞识别方法分类特征训练集

一种主备双路音视频流的帧偏移量人工智能预测方法

视频帧多层感知网络视频流人工智能预测方法时序

项目全流程数据跟踪处理方法及系统

预训练语言模型构建知识图谱知识图谱分析规划项目管理平台

一种射电脉冲数据处理方法及系统

加速器数据处理方法脉冲数据处理系统数据项

一种基于序列电磁干扰采样的磁共振设备主动降噪方法

电磁干扰信号主动降噪方法磁共振设备射频接收线圈采集磁共振信号

音视频多模态联合鉴伪方法、装置、电子设备及存储介质

站点导航

APP 下载