摘要
本发明公开了一种融合ViT和空间特征的深度伪造视频检测方法,属于视频识别技术领域,用于对深度伪造视频进行检测。本发明包含以下步骤:构建融合ViT和空间特征的神经网络;训练深度伪造视频检测网络;获取深度伪造视频中人脸数据信息;将处理后的视频信息输入到训练后的深度伪造视频检测网络并输出是否属于伪造视频。本发明充分利用了卷积神经网络在度视频伪造检测中对图像伪造细节提取方面展现的优势,将正交卷积、注意力机制、残差连接等思想相结合,在维持模型复杂度的同时,提高对深度伪造视频检测的准确性,并且在多种伪造技术生成的视频中均有较稳定的检测性能。
技术关键词
伪造视频检测方法
空间特征提取
通道注意力机制
检测网络模型
双线性插值
sigmoid函数
嵌入位置编码
人脸
视频识别技术
空间特征信息
位置编码信息
网络模块
训练集
非线性
数据
采样点
系统为您推荐了相关专利信息
多模态深度学习
手语识别方法
上下文语义理解
深度卷积神经网络
动作捕捉传感器
位置预测方法
特征提取模块
机械臂
抓取物品
多层感知机
防热结构
优化设计方法
异构
拓扑优化设计
高斯径向基函数
无人机拍摄图像
图片特征信息
算法模型
图像增强模块
损失函数优化
通道注意力机制
多通道特征
去噪方法
数据处理模块
Sigmoid函数