摘要
本申请提供一种基于多层次干扰策略的多模态大语言模型越狱攻击方法,包括:对原始查询进行分解处理,确定多个子查询;对每一子查询进行图像生成处理,确定每一子查询对应的视觉子图像;根据原始查询以及已选择图像与预设的图像数据集中的每一图像的余弦相似度之和,确定对比子图像;根据每一子查询对应的视觉子图像和每一对比子图像,构建复合图像;根据复合图像,确定复合图像对应的无害指令;将复合图像和复合图像对应的无害指令输入多模态大语言模型,执行越狱攻击。通过本申请,采用多层次干扰策略分散多模态大模型的注意力,为模型的安全性分析提供技术手段,推动防御机制的优化与改进。
技术关键词
大语言模型
图像生成模型
编码向量
多模态
视觉
多层次
非临时性计算机可读存储介质
指令
数据
节点
策略
语义结构
模块
存储器
处理器
注意力
电子设备
文本
系统为您推荐了相关专利信息
能力评估模型
滑动窗口机制
能力评估方法
多模态
离线
轮式机器人
智能巡检方法
巡检路径
车间
监控设备
智能人脸识别
智能监控系统
图像增强模块
特征提取单元
计算机视觉
状态空间模型
轻量化结构
拓扑感知能力
输出特征
切块
信息呈现方式
多模态特征融合
负荷
调度员
动态调节系统