摘要
本申请提供了一种多模态深度伪造检测方法及装置,该方法包括:获取目标源视频的视频帧序列和音频序列,基于预设的视觉特征提取模型对视频帧序列进行特征提取得到视觉特征,基于预训练的音频频谱图编码模型对音频序列进行特征提取得到音频特征,对视觉特征和音频特征进行融合,得到对应的融合特征,获取预设的目标多模态深度伪造检测模型,基于目标多模态深度伪造检测模型对融合特征进行伪造鉴别,确定目标源视频的鉴别结果。
技术关键词
多模态深度
音频特征
视频帧
视觉特征提取
序列
融合特征
伪造方法
样本
机器可读指令
跨模态
图像
处理器
可读存储介质
鉴别模块
编码
电子设备
存储器
系统为您推荐了相关专利信息
无人机自动化
地面控制站
巡查系统
协同规划方法
无人机平台
谣言检测方法
情感特征
音频特征
序列
长短期记忆神经网络
音频特征
评价方法
面部表情识别
融合神经网络
姿势识别
免疫检查点抑制剂
免疫治疗策略
肿瘤靶向药物
四丁基碘化铵
药物组合物
推断方法
状态转移模型
特征值
后验概率
粒子滤波算法