基于共享特征攻击的视觉语言模型漏洞确定方法及设备

正文

推荐专利

申请号：CN202510278688

申请日期：2025-03-10

公开号：CN120124073A

公开日期：2025-06-10

类型：发明专利

摘要

本发明提供了一种基于共享特征攻击的视觉语言模型漏洞确定方法及设备。所述方法包括：构建源模型及目标模型，在源模型上生成对抗样本，生成包括优化的扰动；获取对抗特征并计算每个对抗特征对输出的贡献，采用模型增强实现共享对抗特征，并对共享对抗特征进行空间增强和频域增强；将空间增强结果及频域增强结果代入攻击算法对共享对抗特征进行扰动，得到视觉语言模型的漏洞。本发明各个实施例提出的基于共享特征攻击的视觉语言模型漏洞确定的方法在不同模型、数据集和任务上均表现出更优的攻击性能，从而能够对漏洞进行更加充分的确认。本发明在人工智能领域具有非常广泛的应用，研究和提升多模态大模型的鲁棒性，识别并缓解对抗攻击对人工智能系统的潜在威胁，评估人工智能模型在不同攻击场景下的安全性，辅助制定防御策略，并且增强了多模态大模型的可解释性，通过对抗攻击分析模型的决策机制，揭示其潜在漏洞和偏差。

技术关键词

投影特征漏洞视觉人工智能系统人工智能模型通信接口图像编码器样本处理器算法存储器基准计算机指令符号索引多模态鲁棒性

系统为您推荐了相关专利信息

一种微铣削刀具后刀面磨损机器视觉检测方法

机器视觉检测方法后刀面磨损铣削刀具刀具磨损图像边缘检测算子

基于深度神经网络的超高像素图像拼接方法

图像拼接方法像素点深度神经网络亮度偏差

基于扫描电镜观测的目标点快速定位方法及系统

标记扫描电镜关系网络样本立体视觉技术

一种特效视频的生成方法及系统

视频生成模型生成方法视频帧微调技术语义特征

一种基于云端的异地数据处理系统

数据处理系统云端账号下位机设备特征信息

基于共享特征攻击的视觉语言模型漏洞确定方法及设备

站点导航

APP 下载