摘要
本发明公开了用于AIGI检测器鲁棒性测评的对抗样本生成方法、测评方法,涉及鲁棒性测评技术领域,选择一个预训练的替代模型,包含特征提取器和分类器,在特征提取器后并行添加K个附加模型,构建贝叶斯模型,用于模拟受攻击模型;利用对抗样本对贝叶斯模型进行频域攻击,在每次攻击时,对原始对抗样本的空间域添加扰动,将其从空间域转化到频域,并进行随机频谱变换,根据攻击优化目标,计算频域梯度用于更新对抗样本;进一步的,还混合频域攻击与空间域攻击,在每次攻击时还计算空间域梯度,将频域梯度和空间域梯度进行加和平均,得到统一的梯度方向,并使用该梯度方向更新对抗样本,经过设定的迭代攻击次数后,得到最终的对抗样本。本发明利用基于频率的后训练贝叶斯攻击(FPBA)生成对抗样本,从而对AIGI检测器进行高质量的、具有一定泛化能力的攻击,从而在白盒攻击和黑盒攻击下评估AIGI检测器的鲁棒性。
技术关键词
样本生成方法
贝叶斯模型
鲁棒性
检测器
预训练模型
测评方法
参数
图像
离散余弦变换
掩码矩阵
分类器
协方差矩阵
蒙特卡洛方法
测评技术
标签
噪声
计算机程序产品
处理器
系统为您推荐了相关专利信息
编队控制方法
多机器人编队
非奇异终端滑模
编队控制器
通信拓扑结构
三维点云识别方法
文本编码器
图像编码器
多视角
轻量级神经网络