基于多层次干扰策略的多模态大语言模型越狱攻击方法

正文

推荐专利

申请号：CN202510668256

申请日期：2025-05-23

公开号：CN120493247A

公开日期：2025-08-15

类型：发明专利

摘要

本申请提供一种基于多层次干扰策略的多模态大语言模型越狱攻击方法，包括：对原始查询进行分解处理，确定多个子查询；对每一子查询进行图像生成处理，确定每一子查询对应的视觉子图像；根据原始查询以及已选择图像与预设的图像数据集中的每一图像的余弦相似度之和，确定对比子图像；根据每一子查询对应的视觉子图像和每一对比子图像，构建复合图像；根据复合图像，确定复合图像对应的无害指令；将复合图像和复合图像对应的无害指令输入多模态大语言模型，执行越狱攻击。通过本申请，采用多层次干扰策略分散多模态大模型的注意力，为模型的安全性分析提供技术手段，推动防御机制的优化与改进。

技术关键词

大语言模型图像生成模型编码向量多模态视觉多层次非临时性计算机可读存储介质指令数据节点策略语义结构模块存储器处理器注意力电子设备文本

系统为您推荐了相关专利信息

基于多模态数据与在线学习驱动的飞行员操纵能力评估方法及系统

能力评估模型滑动窗口机制能力评估方法多模态离线

轮式机器人的智能巡检方法、控制装置、系统及存储介质

轮式机器人智能巡检方法巡检路径车间监控设备

基于计算机视觉的校园安全智能监控系统

智能人脸识别智能监控系统图像增强模块特征提取单元计算机视觉

一种基于轻量化结构感知视觉状态空间模型的三维OCT处理方法

状态空间模型轻量化结构拓扑感知能力输出特征切块

基于多模态生物反馈的电网调度员认知负荷动态调节系统及方法

信息呈现方式多模态特征融合负荷调度员动态调节系统

基于多层次干扰策略的多模态大语言模型越狱攻击方法

站点导航

APP 下载