面向视听不同步场景的多模态深度伪造检测方法及系统

AITNT
正文
推荐专利
面向视听不同步场景的多模态深度伪造检测方法及系统
申请号:CN202511145903
申请日期:2025-08-15
公开号:CN121033609A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种面向视听不同步场景的多模态深度伪造检测方法及系统,通过融合层级跨模态语义相似性的多模态子空间表示,创新性地解决了视听数据在分布上的不一致性和表征上的异构性问题,通过层次化的语义相似性建模,能够有效对齐视听模态特征,并确保每个模态的特征信息能够在统一的子空间中得到优化表达。模型可以处理视听模态特征之间的差异,使得跨模态特征能够更好地融合,提升了模态间的关联性。不仅增强了深度伪造检测模型在复杂场景下的鲁棒性,还大幅提升了伪造视频的识别精度,尤其在多模态信息相互独立或不完全的情况下,依然能保持较高的识别能力。
技术关键词
视觉特征 模态特征 听觉 视听 注意力机制 场景 特征提取模块 视频 层级 跨模态 匈牙利算法 语义 编码器 序列 关系 阶段 鲁棒性 线性
系统为您推荐了相关专利信息
1
一种基于牙周照片的牙周炎识别系统
多实例 模型训练模块 识别系统 照片 重度牙周炎
2
一种基于OsteoSegNet模型的股骨头图像分割方法
图像分割方法 多层次特征融合 双向特征金字塔 CT图像数据 模块
3
一种炭粉中玻璃颗粒的智能识别与拣选系统及方法
玻璃颗粒 运动滑台 工作平台 滚珠丝杠 直线导轨
4
基于酒店监控及动态巡检的异常行为识别方法
巡检机器人 识别方法 风险 节点 巡检数据
5
一种基于深度学习的脑肿瘤区域自动分割方法及系统
自动分割方法 脑肿瘤医学影像 深度学习模型 多模态脑肿瘤 多头注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号