摘要
本申请实施例提供一种图像分类模型的后门防御方法、图像分类方法及相关设备。后门防御方法包括:获取第一测试数据集、图像分类模型、生成器、第一标签和与第一标签对应的多个第一随机噪声;其中,图像分类模型为生成器的判别器;将第一标签与对应的多个第一随机噪声输入生成器中,输出多个第一扰动量;根据多个第一扰动量的相似度,确定第一标签是否为攻击目标标签;生成第二测试数据集;将第一测试数据集输入图像分类模型,以确定图像分类模型的多个神经元的第一激活状态;将第二测试数据集输入图像分类模型,确定图像分类模型的多个神经元的第二激活状态;根据第一激活状态和第二激活状态,确定图像分类模型的后门神经元,清除后门神经元。
技术关键词
图像分类模型
后门
图像分类方法
标签
随机噪声
图像分类装置
数值
像素点
计算机
处理器
输出模块
指令
存储器
电子设备
关系
坐标
系统为您推荐了相关专利信息
LightGBM模型
客户
信用卡
学习方法
样本
医疗数据采集装置
监护方法
特征提取模块
风险识别模型
时序
XGBoost模型
桥梁
样本
主动学习方法
超参数
血浆代谢标志物
代谢指纹图谱
支持向量机模型
液相色谱质谱联用技术
筛选方法