摘要
本发明公开了一种基于敏感度图的对抗补丁生成方法。该方法首先从标准正态分布抽取潜在向量输入预训练生成器生成初始对抗补丁,经梯度下降优化并结合特定损失函数,再通过多种变换将其叠加到目标图像,验证不同环境下的鲁棒性和有效性;最后通过计算敏感度图和创建掩码矩阵裁剪补丁计算隐蔽性损失,计算对抗检测损失和总变差损失,以此约束生成对抗补丁样本。本发明生成的对抗补丁具有高有效性和隐蔽性,在不同环境下鲁棒性强,可有效欺骗目标深度学习模型,为深度学习模型的安全性评估提供有力支持,有助于提升深度学习系统的安全防护能力。
技术关键词
补丁生成方法
检测损失
掩码矩阵
图像
深度神经网络
深度学习模型
坐标
深度学习系统
有效性
对抗性
样本
像素点
分类准确率
物理
鲁棒性
预测类别
定义
标签