面向视听不同步场景的多模态深度伪造检测方法及系统

正文

推荐专利

申请号：CN202511145903

申请日期：2025-08-15

公开号：CN121033609A

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种面向视听不同步场景的多模态深度伪造检测方法及系统，通过融合层级跨模态语义相似性的多模态子空间表示，创新性地解决了视听数据在分布上的不一致性和表征上的异构性问题，通过层次化的语义相似性建模，能够有效对齐视听模态特征，并确保每个模态的特征信息能够在统一的子空间中得到优化表达。模型可以处理视听模态特征之间的差异，使得跨模态特征能够更好地融合，提升了模态间的关联性。不仅增强了深度伪造检测模型在复杂场景下的鲁棒性，还大幅提升了伪造视频的识别精度，尤其在多模态信息相互独立或不完全的情况下，依然能保持较高的识别能力。

技术关键词

视觉特征模态特征听觉视听注意力机制场景特征提取模块视频层级跨模态匈牙利算法语义编码器序列关系阶段鲁棒性线性

系统为您推荐了相关专利信息

一种基于牙周照片的牙周炎识别系统

多实例模型训练模块识别系统照片重度牙周炎

一种基于OsteoSegNet模型的股骨头图像分割方法

图像分割方法多层次特征融合双向特征金字塔 CT图像数据模块

一种炭粉中玻璃颗粒的智能识别与拣选系统及方法

玻璃颗粒运动滑台工作平台滚珠丝杠直线导轨

基于酒店监控及动态巡检的异常行为识别方法

巡检机器人识别方法风险节点巡检数据

一种基于深度学习的脑肿瘤区域自动分割方法及系统

自动分割方法脑肿瘤医学影像深度学习模型多模态脑肿瘤多头注意力机制

面向视听不同步场景的多模态深度伪造检测方法及系统

站点导航

APP 下载