图像扰动和文本引导协同的多模态大语言模型对抗样本生成方法及装置

正文

推荐专利

申请号：CN202510412034

申请日期：2025-04-02

公开号：CN120407732A

公开日期：2025-08-01

类型：发明专利

摘要

本申请提供一种图像扰动和文本引导协同的多模态大语言模型对抗样本生成方法及装置，涉及计算机技术领域，该方法包括：利用恶意问题集以及当前轮次的引导提示词为目标图像增加扰动生成对抗图像，并将对抗图像、恶意问题集以及当前轮次的引导词输入到模型中，得到针对每个恶意问题的回复内容；基于模型针对每个恶意问题的回复内容，生成针对模型回复内容的共性问题和改进建议，并生成下一轮次的引导提示词；进行对抗图像和引导提示词的迭代，直至满足预设结束条件后，生成对抗样本。本申请提供的图像扰动和文本引导协同的多模态大语言模型对抗样本生成方法及装置，通过引入视觉和文本上的额外信息，大幅提升对抗样本在进行对抗样本测试时的效果。

技术关键词

大语言模型生成对抗图像样本生成方法多模态文本处理器生成装置可读存储介质存储器电子设备模块视觉计算机程序基础

系统为您推荐了相关专利信息

一种基于大语言模型和OCR技术的肿瘤患者临床试验匹配系统及方法

大语言模型生成结构化数据流水线模块临床决策支持时序神经网络

一种生产效率监管方法

监管方法注意力机制 Word2Vec模型文本 GRU模型

车载健康监测联动多模态疗愈装置及方法

多模态减震组件照明组件减震筒盒体

一种同时利用图与树结构的图检索增强生成方法

实体大语言模型生成方法检索策略索引

一种基于大语言模型的代码修复方法、装置、设备及介质

代码修复方法大语言模型代码扫描工具生成提示词模版

图像扰动和文本引导协同的多模态大语言模型对抗样本生成方法及装置

站点导航

APP 下载