摘要
本发明公开了一种基于知识蒸馏的后门模型检测方法、系统及电子设备,方法包括以下步骤:步骤1:构造与原始后门数据集在数据类别分布一致的数据集;步骤2:将构造好的数据集输入待检测的目标模型,得到目标模型的软标签输出;步骤3:将目标模型的软标签替换数据集的原始标签;步骤4:学生模型从教师模型的软标签中学习,进行后门攻击检测。本发明旨在通过较低的时间和计算成本,识别后门模型在干净样本上表现出的更为普遍和通用的后门异常行为,从而使能在模型部署前,有效评估那些训练过程未知的公开模型的安全性。
技术关键词
模型检测方法
后门
标签
蒸馏
数据
模型检测系统
教师
学生
电子设备
处理器
输出模块
样本
程序
精度
总量
存储器
系统为您推荐了相关专利信息
混合神经网络模型
优化控制策略
实时监测数据
优化控制方法
交通特征
协同感知系统
激光雷达
融合特征
特征地图
网格特征
集成管理系统
联网设备
远程控制模块
诊断模块
数据采集模块
倾角传感器
倾角测量方法
塔筒基础
风机塔筒
双轴高精度
实时数据采集系统
工程图纸
数据挖掘算法
机器学习算法
集成学习策略