摘要
本发明涉及对抗防御技术领域,特别涉及一种思维链引导的多模态大模型对抗样本检测方法及装置。方法包括:将干净图像样本输入至目标多模态大模型,获得第一注意力分布矩阵;获得在使用思维链提示词时的第二注意力分布矩阵;生成注意力偏移矩阵;对注意力偏移矩阵进行可视化处理;通过投影梯度下降法,对干净图像样本添加对抗扰动,获得对抗样本;通过干净图像样本和对抗样本对分类器进行预训练;将注意力偏移矩阵输入预训练的分类器,判断干净图像样和对抗样本。防御方法和装置不考虑引入额外的多模态大模型,从而减少失效的概率,确保系统能够在大多数情况下正确的判断原始多模态大模型是否受到了来自外界的对抗攻击,进而起到防御的效果。
技术关键词
注意力
矩阵
样本检测方法
图像
多模态
梯度下降法
样本检测设备
样本检测装置
计算机可读指令
识别对抗样本
支持向量机分类器
令牌
模块
训练集
标签
处理器
可读存储介质
图片
系统为您推荐了相关专利信息
电压调节方法
可再生能源
微电网
多头注意力机制
机器可读指令
分级分类方法
标签体系
数据清洗算法
生成特征向量
谱聚类算法
视觉特征
图像检测方法
文本编码器
模块
计算机程序指令
车辆行驶测试
行驶状态数据
环境传感装置
电磁兼容测试
速度控制方式
稳定性分析方法
频率控制系统
矩阵
系统稳定性分析
时延