摘要
本发明涉及一种深度伪造内容检测方法。适用于计算机人工智能深度伪造内容检测领域。本发明所采用的技术方案是:该方法包括:获取待检测视频内容,分离音频和视频,并基于音频得到音频序列,基于视频得到视频人脸序列;将音频序列和视频人脸序列输入经训练的音视频一致性检测模型,得到待检测视频内容的音视频一致性检测结果;所述音视频一致性检测模型包括:视觉编码器,经音、视频对比学习预训练;音频编码器,与视觉编码器一同经音、视频对比学习预训练;特征融合模块,用于融合视觉编码器提取的一致性特征和音频编码器提取的一致性特征,得到融合特征;音视频一致性检测器,用于基于特征融合模块的融合特征,得到音视频一致性概率。
技术关键词
音频编码器
内容检测方法
音视频双模态
一致性检测
序列
多模态深度
融合特征
分类器
移动端
计算机人工智能
检测器
音频特征
人脸特征
样本
模型剪枝
模块
系统为您推荐了相关专利信息
图像数据处理方法
多模态数据融合
指数
边缘定位误差
标记
风电集群功率预测方法
生成对抗网络
长短期记忆神经网络
格兰杰因果关系
组合预测模型
区域建议网络
数据采集节点
误差反向传播
随机梯度下降
序列
注意力模型
推荐方法
序列
非暂态计算机可读存储介质
节点