摘要
本发明提供一种基于跨模态视觉大语言模型的多种图像伪造检测方法及系统,涉及图像处理与计算机视觉技术领域,所述方法包括:构建数据集,对数据集进行预处理;根据预处理的数据,通过预训练视觉Transformer和语言模型分别提取视觉特征和语言特征,以得到跨模态特征;根据跨模态特征,对视觉和语言特征分别聚类,计算跨模态相似度建立匹配关系,并进行融合,得到融合后的多模态特征;根据融合后的多模态特征,通过生成器和判别器进行对抗训练,以生成对抗网络。本发明实现高精度检测与定位拼接、复制粘贴、AIGC生成等多种图像伪造类型进行有效检测。
技术关键词
跨模态
多粒度特征
大语言模型
生成对抗网络
视觉特征
图像伪造检测系统
融合特征
注意力机制
预训练语言模型
计算机视觉技术
数据
聚类
多模态特征
训练分类器
语义
可读存储介质
处理器
系统为您推荐了相关专利信息
可视化检索方法
画像
标签
多模态数据库
识别用户角色
大语言模型
学习训练方法
学习训练装置
计算机程序产品
指标
认知功能障碍
预警方法
脑电特征提取
轨迹
隐马尔可夫模型