摘要
本发明属于人工智能安全技术领域,公开了一种基于对抗样本的黑盒模型测试方法,包括:步骤1、确定待测试的目标黑盒模型TB,使用相同的训练集训练黑盒模型TB的替代模型S,统计替代模型S对于目标标签tl的预测准确率;步骤2、用训练集训练替代模型S,使得替代模型S遗忘定向攻击的目标标签tl的特征,得到遗忘模型S';步骤3、利用对抗样本生成方法在遗忘后的模型S'上生成能被成功预测为目标标签tl的定向对抗样本xadv;步骤4、将生成的对抗样本用于目标黑盒模型TB上进行测试,计算模型抵御对抗样本的成功率。本发明解决了因模型结构、参数差异导致的对抗样本失效问题,能显著提高对抗样本的迁移性,提升了在黑盒场景下的模型测试效果。
技术关键词
黑盒模型
标签
测试方法
样本生成方法
训练集
参数
优化器
加载器
图像
数值
色彩
噪声
场景
数据
系统为您推荐了相关专利信息
数据分析模块
RFID智能柜
数据获取模块
RFID扫描器
RFID标签
数据驱动模型
性能预测方法
性能预测模型
数据驱动方法
强度