摘要
本发明实施例公开了一种挖掘多模态大型语言模型漏洞并进行防范的方法。本发明实施例中,通过获取图文信息;将所述图像信息和/或所述文本信息进行切分,生成N个图像单元和/或M个文本单元;将N个图像单元和/或M个文本单元随机打乱,生成打乱后的目标图文信息;将所述目标图文信息输入到多模态大型语言模型中,输出应答文本;将所述应答文本输入到预先设置的判别模型中,获取判别结果;响应于所述判别结果为有害,则确定所述图文信息挖掘漏洞成功;并根据所述多模态大型语言的漏洞,确定所述多模态大型语言的防范策略。通过上述方法,可以越过多模态大型语言模型的安全机制,实现对潜在安全漏洞的有效挖掘,进而提高防御能力。
技术关键词
多模态
图文
文本
漏洞
图像
计算机程序指令
可读存储介质
处理单元
元素
策略
分块
处理器
存储器
电子设备
机制
系统为您推荐了相关专利信息
调节阀开度
三维点云模型
监测方法
标记
立体成像
车辆可行驶区域
预测类别
特征提取模型
图像
样本
视频数据处理方法
暗场成像
关键点
深度神经网络模型
白细胞