基于多模态大语言模型的视觉问答系统对抗攻击方法、电子设备及可读存储介质

AITNT
正文
推荐专利
基于多模态大语言模型的视觉问答系统对抗攻击方法、电子设备及可读存储介质
申请号:CN202510731627
申请日期:2025-06-03
公开号:CN120632931A
公开日期:2025-09-12
类型:发明专利
摘要
本发明属于大语言模型技术领域,具体涉及基于多模态大语言模型的视觉问答系统对抗攻击方法、电子设备及可读存储介质。方法为:1.利用替代模型生成干净的图像‑文本对的候选错误答案;2.候选错误答案和干净的文本构建陈述句提示;3.利用多模态大语言模型迭代式生成新的误导图像;4.利用损失函数的梯度信息优化扰动,生成对抗性图像;5.利用多模态大语言模型生成候选对抗性文本;6.利用多模态大语言模型生成候选文本和原始文本的相似度;7.根据相似度筛选最终对抗性文本;8.将对抗性图像和对抗性文本送入黑盒模型攻击。本发明构建了图像‑文本多模态协同攻击范式,使视觉误导特征与文本语义扰动相辅相成,显著提升对抗样本在黑盒环境下的攻击效能。
技术关键词
大语言模型 对抗性 问答系统 文本 答案 图像编码器 视觉 黑盒模型 多模态协同 电子设备 可读存储介质 标记特征 计算机 处理器 存储器 样本
系统为您推荐了相关专利信息
1
基于异构映射网络和多层级特征增强的轻量化图像描述系统
交叉注意力机制 解码器 异构 网络 层级
2
一种基于大语言模型可解释决策的智能面试评分系统
大语言模型 文本 多模态 语义 图谱
3
模型生成方法、音效描述生成方法、设备、介质及产品
音效 音频 文本 模型生成方法 混响参数
4
基于卷积神经网络的手写字符识别方法及系统
手写字符识别方法 语音输入方式 错误率 对比度 支持向量机模型
5
生成描述医学成像数据集之间的改变的自然语言文本
医学成像数据 自然语言文本 图像特征向量 计算机可读程序代码 生成代表
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号