一种用于时间伪造定位的多模态深度伪造检测模型

正文

推荐专利

申请号：CN202510775152

申请日期：2025-06-11

公开号：CN120318593B

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及网络安全技术等领域，公开了一种用于时间伪造定位的多模态深度伪造检测模型，在于解决现有检测方法中对细微尺度伪造特征表示不足的问题以及现有方法不能有效捕捉图像伪造伪影的问题；包括视觉特征提取模块和音频特征提取模块所构成的特征提取模块；通过构建注意力图的方式在特征通道维度中融合视觉特征表示和音频特征表示的自适应多模态特征融合模块；对视觉特征表示和音频特征表示进行处理得到视觉帧级预测标签和音频帧级预测标签的帧分类模块；及通过对视觉特征表示、音频特征表示、多模态融合特征、视觉帧级预测标签和音频帧级预测标签进行处理，得到最终的伪造边界预测的边界定位模块。

技术关键词

多模态特征融合特征提取模块音频特征提取视觉特征提取融合特征序列融合视觉特征标签注意力通道定位模块色彩短时傅里叶变换图像

系统为您推荐了相关专利信息

一种电力通信调度语音对话的摘要生成方法及装置

网络单元摘要生成方法记忆神经网络架构注意力机制

骨性解剖结构分割方法、装置、设备、介质和产品

解剖结构分割卷积神经网络模块视频帧解码模块医学

基于大数据的图文检索方法及系统

图文检索方法图像匹配文本生成图文生成图像特征

一种工程塑料生产质量检测方法及系统

工程塑料表面多尺度滑动窗口跨模态融合特征注塑机视觉特征提取

一种基于MoCo的文本引导多模型医学图像分割方法

编码器医学图像分割方法文本注意力多模型

一种用于时间伪造定位的多模态深度伪造检测模型

站点导航

APP 下载