基于图片重构损失的迁移对抗攻击方法、装置及电子设备

正文

推荐专利

申请号：CN202411514235

申请日期：2024-10-29

公开号：CN119027690A

公开日期：2024-11-26

类型：发明专利

摘要

本发明公开了基于图片重构损失的迁移对抗攻击方法、装置及电子设备，属于视觉语言大模型技术领域。方法包括：以CLIP的图片编码器作为编码器并训练基于MAE架构的解码器，获得训练好的编码器‑解码器模型；将原始图片输入编码器‑解码器模型，同时基于投影梯度下降法最大化编码器‑解码器模型输出图片相对于原始图片的重构损失，生成对抗样本；将对抗样本迁移至视觉语言大模型进行攻击，检测视觉语言大模型的鲁棒性。本发明通过增大图片重构损失进行优化，并生成对抗样本用于对视觉语言大模型进行攻击，可拓展至不同的文本提示和场景下，具有较好的可拓展性。

技术关键词

解码器模型图片编码器重构梯度下降法视觉编码特征样本鲁棒性模型训练模块电子设备处理器随机噪声存储器像素指令标记参数

基于图片重构损失的迁移对抗攻击方法、装置及电子设备

站点导航

APP 下载