一种面向分割学习的模型后门攻击脆弱性分析方法和系统

正文

推荐专利

申请号：CN202410781553

申请日期：2024-06-18

公开号：CN118366010B

公开日期：2024-09-20

类型：发明专利

摘要

本发明公开了一种面向分割学习的模型后门攻击脆弱性分析方法和系统，属于人工智能安全领域。收集图像分类模型在分割学习过程中由客户端底层模型发送至服务器端中间模型的第一中间层表示，结合辅助数据集迭代训练底层替代模型；利用第一中间层表示训练聚类器，获取聚类类别到真实类别的映射关系，得到锚点；基于统计思想获取与图像触发器对应的中间层表示触发器；基于中间层表达形式的锚点替换目标类样本的后门攻击方法，向中间模型注入后门并训练；利用测试样本检测图像分类模型的后门攻击成功率，获得模型后门攻击脆弱性。本发明综合考虑了攻击测试方法的成功率和隐蔽性，可以更加全面的暴露模型在分割学习框架下的漏洞，推动防御技术的发展。

技术关键词

中间层图像分类模型后门分析方法样本服务端数据锚点副本攻击测试方法标签客户端两阶段聚类匈牙利算法模型训练模块关系数值分析系统

系统为您推荐了相关专利信息

基于特征融合和动态原型合成的小样本医学图像分割方法

原型医学图像分割方法查询特征融合特征医学图像分割模型

基于图文对比辅助学习的人脸反欺诈模型训练方法及装置

反欺诈模型识别人脸图像预训练模型图像编码器样本

一种跨场景多域融合小样本遥感目标鲁棒识别方法

鲁棒识别方法增量式优化方法边界特征多级特征融合注意力机制

一种无人机目标检测与识别方法及介质

识别方法卷积神经网络结构卷积神经网络训练无人机飞行信息输出特征

兼容多类型待测样本的自动化测序前处理设备

固态生物样本接收装置混合装置入口核酸提取装置

一种面向分割学习的模型后门攻击脆弱性分析方法和系统

站点导航

APP 下载