一种基于跨模态视觉大语言模型的多种图像伪造检测方法及系统

AITNT
正文
推荐专利
一种基于跨模态视觉大语言模型的多种图像伪造检测方法及系统
申请号:CN202510426514
申请日期:2025-04-07
公开号:CN120355985A
公开日期:2025-07-22
类型:发明专利
摘要
本发明提供一种基于跨模态视觉大语言模型的多种图像伪造检测方法及系统,涉及图像处理与计算机视觉技术领域,所述方法包括:构建数据集,对数据集进行预处理;根据预处理的数据,通过预训练视觉Transformer和语言模型分别提取视觉特征和语言特征,以得到跨模态特征;根据跨模态特征,对视觉和语言特征分别聚类,计算跨模态相似度建立匹配关系,并进行融合,得到融合后的多模态特征;根据融合后的多模态特征,通过生成器和判别器进行对抗训练,以生成对抗网络。本发明实现高精度检测与定位拼接、复制粘贴、AIGC生成等多种图像伪造类型进行有效检测。
技术关键词
跨模态 多粒度特征 大语言模型 生成对抗网络 视觉特征 图像伪造检测系统 融合特征 注意力机制 预训练语言模型 计算机视觉技术 数据 聚类 多模态特征 训练分类器 语义 可读存储介质 处理器
系统为您推荐了相关专利信息
1
一种基于AI的可视化检索方法及系统
可视化检索方法 画像 标签 多模态数据库 识别用户角色
2
一种大语言模型的强化学习训练方法及相关设备
大语言模型 学习训练方法 学习训练装置 计算机程序产品 指标
3
一种基于解耦对比学习的RGB-D显著目标检测方法
像素 融合特征 注意力 跨模态 多尺度语义特征
4
诈骗线索生成方法、装置及设备
关键词 文本 线索 生成方法 长短期记忆模型
5
基于脑电微状态与眼动轨迹的认知功能障碍预警方法及其装置
认知功能障碍 预警方法 脑电特征提取 轨迹 隐马尔可夫模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号