摘要
本发明提供了一种基于扩散模型的对抗攻击方法,属于图像分类的对抗攻击领域,该方法包括:获取文本,并使用多模态目标检测模型预测图像中文本对应的检测框;使用分割大模型预测检测框对应的遮罩,并整合遮罩集合得到对抗攻击的目标区域;获取图像,并利用稳定扩散模型将图像映射至图像对应的潜在空间中,并保存每一步的潜在向量;迭代对抗攻击并对潜在空间添加扰动,并结合目标区域和潜在向量,利用将扩散过程和区域选择引入对抗攻击的策略生成对抗样本,完成基于扩散模型的对抗攻击。本发明构建基于扩散模型的对抗攻击方法,大幅提高对抗样本的视觉质量,使扰动难以察觉,并大幅提升对抗样本的黑盒迁移能力,在模型安全性验证中具有广泛的应用前景。
技术关键词
图像
分类器
文本
多模态
注意力
样本
标签类别
编码器
解码器
策略
矩阵
视觉
误差
参数
系统为您推荐了相关专利信息
文本情感分析方法
主题模型分析
语句
自然语言
文本情感分析系统
数字孪生
计算机执行指令
设备配置
产品全生命周期
生成产品
加权无向图
字典
拉普拉斯
协方差矩阵
线性变换矩阵
智能安全帽
电力装表
智能识别方法
解码视频数据
视频流
成分含量分析方法
光谱特征参量
光谱吸收特征
评估算法
多光谱成像技术