一种检测与定位多模态媒体图文同步伪造的方法

正文

推荐专利

申请号：CN202510197027

申请日期：2025-02-21

公开号：CN120125979A

公开日期：2025-06-10

类型：发明专利

摘要

本发明公开了一种检测与定位多模态媒体图文同步伪造的方法，本发明通过在图文编码部分，利用伪造感知对比学习对齐图像与文本的整体语义嵌入，从而更好地捕捉图像与文本之间的语义关联和潜在的不一致信息，在进行多模态融合时，通过在图文与视音频模态之间进行细粒度的语义交互与深层次的特征融合，利用视音频提供的图文上下文信息对图像特征和文本特征进行增强，从而便于更深层次地揭示图文伪造痕迹，同时通过图文同步伪造检测，实现了对图文对真实性的精准判断和图文同步伪造类型的有效识别，并通过图文同步伪造定位，实现了对图像伪造区域和文本伪造词元的高精度识别，从而使得图文同步伪造的精准检测与定位性能得到显著提升。

技术关键词

图文视音频多模态文本语义媒体异常检测器交叉注意力机制分类器编码器关键帧视频图像嵌入样本定位标签局部时空特征

系统为您推荐了相关专利信息

一种基于扩散模型的矢量图纸生成模型训练方法及系统

生成模型训练方法图纸编辑随机噪声传播算法

生成式人工智能多态敏感拼图检测方法、装置及设备

图像特征提取模型拼图图像生成模型人工智能模型信息熵

基于音频文本跨模态多损失融合网络的电力设备异常检测方法

注意力编码器跨模态网络计算机程序指令文本

一种基于虚拟仿真的模具模架设计系统

模具模架设计系统混合智能优化数字孪生建模数据

异常通信的监测方法、装置、设备、存储介质和程序产品

告警平台终端混音器网络设备接收器

一种检测与定位多模态媒体图文同步伪造的方法

站点导航

APP 下载