基于多模态大语言模型的视觉问答系统对抗攻击方法、电子设备及可读存储介质

正文

推荐专利

申请号：CN202510731627

申请日期：2025-06-03

公开号：CN120632931A

公开日期：2025-09-12

类型：发明专利

摘要

本发明属于大语言模型技术领域，具体涉及基于多模态大语言模型的视觉问答系统对抗攻击方法、电子设备及可读存储介质。方法为：1.利用替代模型生成干净的图像‑文本对的候选错误答案；2.候选错误答案和干净的文本构建陈述句提示；3.利用多模态大语言模型迭代式生成新的误导图像；4.利用损失函数的梯度信息优化扰动，生成对抗性图像；5.利用多模态大语言模型生成候选对抗性文本；6.利用多模态大语言模型生成候选文本和原始文本的相似度；7.根据相似度筛选最终对抗性文本；8.将对抗性图像和对抗性文本送入黑盒模型攻击。本发明构建了图像‑文本多模态协同攻击范式，使视觉误导特征与文本语义扰动相辅相成，显著提升对抗样本在黑盒环境下的攻击效能。

技术关键词

大语言模型对抗性问答系统文本答案图像编码器视觉黑盒模型多模态协同电子设备可读存储介质标记特征计算机处理器存储器样本

系统为您推荐了相关专利信息

基于异构映射网络和多层级特征增强的轻量化图像描述系统

交叉注意力机制解码器异构网络层级

一种基于大语言模型可解释决策的智能面试评分系统

大语言模型文本多模态语义图谱

模型生成方法、音效描述生成方法、设备、介质及产品

音效音频文本模型生成方法混响参数

基于卷积神经网络的手写字符识别方法及系统

手写字符识别方法语音输入方式错误率对比度支持向量机模型

生成描述医学成像数据集之间的改变的自然语言文本

医学成像数据自然语言文本图像特征向量计算机可读程序代码生成代表

基于多模态大语言模型的视觉问答系统对抗攻击方法、电子设备及可读存储介质

站点导航

APP 下载