摘要
本发明属于大语言模型技术领域,具体涉及基于多模态大语言模型的视觉问答系统对抗攻击方法、电子设备及可读存储介质。方法为:1.利用替代模型生成干净的图像‑文本对的候选错误答案;2.候选错误答案和干净的文本构建陈述句提示;3.利用多模态大语言模型迭代式生成新的误导图像;4.利用损失函数的梯度信息优化扰动,生成对抗性图像;5.利用多模态大语言模型生成候选对抗性文本;6.利用多模态大语言模型生成候选文本和原始文本的相似度;7.根据相似度筛选最终对抗性文本;8.将对抗性图像和对抗性文本送入黑盒模型攻击。本发明构建了图像‑文本多模态协同攻击范式,使视觉误导特征与文本语义扰动相辅相成,显著提升对抗样本在黑盒环境下的攻击效能。
技术关键词
大语言模型
对抗性
问答系统
文本
答案
图像编码器
视觉
黑盒模型
多模态协同
电子设备
可读存储介质
标记特征
计算机
处理器
存储器
样本
系统为您推荐了相关专利信息
手写字符识别方法
语音输入方式
错误率
对比度
支持向量机模型
医学成像数据
自然语言文本
图像特征向量
计算机可读程序代码
生成代表