摘要
本发明提供一种图像识别模型的对抗攻击方法,方法包括:获取待识别图像,并构建掩码图像以及扰动图像,待识别图像携带有真实标签;根据第一特征对齐网络以及掩码图像的掩码特征图构建特征损失函数,并基于特征损失函数训练第一特征对齐网络得到第二特征对齐网络;在图像识别模型中加入第二特征对齐网络得到对抗攻击模型,并通过对抗攻击模型构建得到对抗样本;根据真实标签确定对抗攻击任务,并在对抗攻击任务下,通过对抗样本对图像识别模型进行对抗攻击,得到图像识别模型针对所述待识别图像的对抗攻击结果。通过本申请,同时针对标签层面以及特征层面,提出新的对抗攻击模型以及对抗样本,有效提高对抗攻击模型和对抗样本的迁移性。
技术关键词
图像识别模型
预训练模型
网络
标签
加权特征
样本
像素
处理器
模块
存储器
电子设备
程序
参数