基于可解释性的图像分类模型后门防御方法和装置

正文

推荐专利

申请号：CN202411580246

申请日期：2024-11-07

公开号：CN119672398A

公开日期：2025-03-21

类型：发明专利

摘要

本发明提供了一种基于可解释性的图像分类模型后门防御方法和装置，方法包括：搭建后门实验环境基准训练图像分类的干净模型和后门模型；对训练后的干净模型和后门模型进行可解释性实验，获取所述数据集下各个类别的概念并进行筛选；基于筛选后的概念进行可解释表现的综合特征向量构造；将构造的综合特征向量作为输入训练用于区分干净模型和后面模型的二分类器；利用二分类器判断待测图像分类模型是否属于后门模型。本发明通过引入基于可解释性的图像分类模型后门防御方法，利用模型在不同可解释方法下的表现差异，有效区分干净模型和后门模型，实现对后门注入攻击的检测和防御，具有较高的检测准确性和实用性，提升了模型的安全性和可靠性。

技术关键词

图像分类模型后门概念二分类器颜色支持向量机法 Canny算子纹理特征提取样本边缘检测像素块分类器训练处理器基准数据可读存储介质存储器

系统为您推荐了相关专利信息

一种基于手部特征的热成像与可见光配准方法

可见光图像手部特征关键点特征配准方法可见光相机

基于大语言模型的制导武器知识图谱构建方法及系统

知识图谱构建方法大语言模型验证规则实体关系数据生成知识图谱

一种环保涂料类油漆颜色测定方法及系统

环保涂料颜色测定方法油漆释放量多元线性回归模型

一种产品测试方法、数据管理方法、装置、介质及控制器

产品测试方法产品测试装置人工智能模型脚本编译系统集合系统

一种基于GAN网络的模糊语义识别方法

模糊语义识别方法噪声语音语音信号特征序列

基于可解释性的图像分类模型后门防御方法和装置

站点导航

APP 下载