基于音视频时域融合的深度伪造检测方法和系统

AITNT
正文
推荐专利
基于音视频时域融合的深度伪造检测方法和系统
申请号:CN202510161275
申请日期:2025-02-13
公开号:CN119992422A
公开日期:2025-05-13
类型:发明专利
摘要
本发明提供一种基于音视频时域融合的深度伪造检测方法和系统,利用一个自监督的特征提取器捕获音频和视频两个模态间的不连续性,首先使用残差网络提取视频特征,使用前馈网络提取音频特征,然后使用Transformer编码器对合并的视频特征和音频特征进行融合;同时,视频特征和音频特征也分别被输入到Transformer编码器进行高维特征提取;最终,由Transformer编码器得到的视频特征、音频特征、音视频融合特征被合并在一起,通过多尺度时域卷积网络进行深度特征融合,并通过时域池化层和线性层得到最终的检测结果。本发明能够充分的利用深度伪造视频的多模态信息,提升深度伪造视频检测的准确率。
技术关键词
音频特征 时域卷积网络 注意力 模态特征 残差网络 前馈神经网络 分支 多尺度 存储程序代码 多模态 特征提取模块 对音视频 深度特征融合 编码器 人脸 可读存储介质 特征提取器
系统为您推荐了相关专利信息
1
一种视觉语言大模型的参数对齐方法、装置及存储介质
文本特征向量 图像特征向量 多模态 三元组损失函数 视觉
2
一种基于特征耦合的工业产品表面缺陷检测方法
工业产品表面缺陷 剪枝策略 融合特征 高层语义信息 特征融合网络
3
一种基于雷达多目标跟踪的轨迹预测方法
轨迹预测方法 JPDA算法 车辆 雷达 匈牙利算法
4
一种基于深度学习的食品图像识别与热量检测方法
热量检测方法 菜品图像 决策级融合方法 检测食物 ResNet网络
5
融合船载雷达测波的船舶操纵运动轨迹预报方法及系统
轨迹预报方法 前馈神经网络 船载雷达 船舶运动状态 长短期记忆网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号