摘要
本发明公开了一种面向对抗补丁攻击的防御方法,利用掩码重构任务具有良好特征提取能力的特点,通过设计对抗性掩码生成方法和分类‑重构联合训练方法,实现了一种面向对抗补丁攻击的防御方法,面向对抗补丁攻击的防御方法将图像识别模型划分为主干网络和全连接层,分别用于特征提取和分类预测,将重构模型连接在主干网络后,用于接收主干网络提取的图像特征并重构图像,连接后的图像识别模型主干网络、全连接层和重构模型总体称为训练模型。这种连接方式无需修改原有图像识别模型的结构,只优化原有模型的权重参数,适用于任意架构的深度学习视觉模型,适用于任意训练状态的模型,而无需强制从头训练。
技术关键词
图像识别模型
掩码生成方法
重构模型
补丁
样本
对抗性
联合训练方法
网络
特征提取能力
更新模型参数
标签
模型更新
图像块
符号
矩阵
代表
误差