一种基于特征劫持的统一视觉语言模型后门攻击方法

正文

推荐专利

申请号：CN202510811596

申请日期：2025-06-17

公开号：CN120726417A

公开日期：2025-09-30

类型：发明专利

摘要

本发明公开了一种基于特征劫持的统一视觉语言模型后门攻击方法，步骤如下：获取数据集及统一视觉语言模型；初始化多模态触发器，触发检测器，动态特征对齐模块等后门模块；构建有害数据集，从训练集中随机选取一部分样本，为样本注入多模态触发器，生成中毒样本，将原训练数据和生成的中毒样本数据混合，生成有害数据集；使用有害数据集对模型进行训练，冻结模型原始参数，仅允许后门模块参与训练；模型推理，训练生成的中毒模型在良性测试样本上表现正常，但当文本和图像后门触发器同时存在时，模型将输出预设答案，实现后门攻击。本发明提供的方法解决了由于仅采用单模触发或特征扰动不足而导致对统一视觉语言模型攻击效果不足的问题。

技术关键词

后门样本对齐模块文本图像检测器模块参数答案数据多模态特征多层卷积神经网络子模块视觉特征动态神经网络结构

系统为您推荐了相关专利信息

一种集成式行车记录仪系统及车辆

行车记录仪系统全景控制器 DCDC转换器车身控制器显示设备

一种行人检索驱动的特定人脸检测方法和装置

行人重识别模型人脸检测方法道路监控视频卷积模块构建训练集

一种城市天际线图像提取方法

图像提取方法仿真模型数字城市规划 GPS轨迹数据开放街道地图

一种仪表功能安全的显示屏装置

显示屏装置控制模块传感器模块背光驱动芯片输入端

一种基于增量式神经网络模型的AIDS预测方法

增量式神经网络模型增量式数据样本时间段艾滋病防治

一种基于特征劫持的统一视觉语言模型后门攻击方法

站点导航

APP 下载