一种基于跨模态视觉大语言模型的多种图像伪造检测方法及系统

正文

推荐专利

申请号：CN202510426514

申请日期：2025-04-07

公开号：CN120355985A

公开日期：2025-07-22

类型：发明专利

摘要

本发明提供一种基于跨模态视觉大语言模型的多种图像伪造检测方法及系统，涉及图像处理与计算机视觉技术领域，所述方法包括：构建数据集，对数据集进行预处理；根据预处理的数据，通过预训练视觉Transformer和语言模型分别提取视觉特征和语言特征，以得到跨模态特征；根据跨模态特征，对视觉和语言特征分别聚类，计算跨模态相似度建立匹配关系，并进行融合，得到融合后的多模态特征；根据融合后的多模态特征，通过生成器和判别器进行对抗训练，以生成对抗网络。本发明实现高精度检测与定位拼接、复制粘贴、AIGC生成等多种图像伪造类型进行有效检测。

技术关键词

跨模态多粒度特征大语言模型生成对抗网络视觉特征图像伪造检测系统融合特征注意力机制预训练语言模型计算机视觉技术数据聚类多模态特征训练分类器语义可读存储介质处理器

系统为您推荐了相关专利信息

一种基于AI的可视化检索方法及系统

可视化检索方法画像标签多模态数据库识别用户角色

一种大语言模型的强化学习训练方法及相关设备

大语言模型学习训练方法学习训练装置计算机程序产品指标

一种基于解耦对比学习的RGB-D显著目标检测方法

像素融合特征注意力跨模态多尺度语义特征

诈骗线索生成方法、装置及设备

关键词文本线索生成方法长短期记忆模型

基于脑电微状态与眼动轨迹的认知功能障碍预警方法及其装置

认知功能障碍预警方法脑电特征提取轨迹隐马尔可夫模型

一种基于跨模态视觉大语言模型的多种图像伪造检测方法及系统

站点导航

APP 下载