一种思维链引导的多模态大模型对抗样本检测方法及装置

正文

推荐专利

申请号：CN202510891996

申请日期：2025-06-30

公开号：CN120411734B

公开日期：2025-09-30

类型：发明专利

摘要

本发明涉及对抗防御技术领域，特别涉及一种思维链引导的多模态大模型对抗样本检测方法及装置。方法包括：将干净图像样本输入至目标多模态大模型，获得第一注意力分布矩阵；获得在使用思维链提示词时的第二注意力分布矩阵；生成注意力偏移矩阵；对注意力偏移矩阵进行可视化处理；通过投影梯度下降法，对干净图像样本添加对抗扰动，获得对抗样本；通过干净图像样本和对抗样本对分类器进行预训练；将注意力偏移矩阵输入预训练的分类器，判断干净图像样和对抗样本。防御方法和装置不考虑引入额外的多模态大模型，从而减少失效的概率，确保系统能够在大多数情况下正确的判断原始多模态大模型是否受到了来自外界的对抗攻击，进而起到防御的效果。

技术关键词

注意力矩阵样本检测方法图像多模态梯度下降法样本检测设备样本检测装置计算机可读指令识别对抗样本支持向量机分类器令牌模块训练集标签处理器可读存储介质图片

系统为您推荐了相关专利信息

用于多源发电特性微电网的自适应电压调节方法及系统

电压调节方法可再生能源微电网多头注意力机制机器可读指令

数据分级分类方法及装置

分级分类方法标签体系数据清洗算法生成特征向量谱聚类算法

图像检测方法、电子设备和存储介质

视觉特征图像检测方法文本编码器模块计算机程序指令

一种车辆行驶测试跟踪被测车辆的方法、测试汽车和系统

车辆行驶测试行驶状态数据环境传感装置电磁兼容测试速度控制方式

时滞攻击下电网负荷频率的稳定性分析方法、系统及装置

稳定性分析方法频率控制系统矩阵系统稳定性分析时延

一种思维链引导的多模态大模型对抗样本检测方法及装置

站点导航

APP 下载