摘要
本发明提供了一种文本到图像生成模型的黑盒攻击方法,包括:初始化步骤,加载第一提示文本,生成各提示位置的同义词候选集;文生图步骤,根据提示文本生成图像;违规检测步骤,判断图像是否含有违规内容;第一替换向量步骤,若不含有违规内容,初始化连续位置替换向量;第二替换向量步骤,对连续位置替换向量进行采样,得到离散位置替换向量,并使用离散位置替换向量对同义词候选集进行提示替代,生成第二提示文本,并返回到文生图步骤。本发明还提供一种文本到图像生成模型的黑盒攻击装置、存储介质及电子设备。借此,本发明解决了现有黑盒攻击依赖文本编码器知识、离散提示优化困难、梯度不可用等问题,提高了防御穿透性、计算效率和泛化能力。
技术关键词
图像生成模型
文本生成图像
同义词
预训练语言模型
文本编码器
估计算法
电子设备
模块
处理器
阶梯
坐标
系统为您推荐了相关专利信息
图像生成模型
关键词
生成文案
文本
LightGBM模型
语音特征
大语言模型
序列生成器
模型训练方法
拼音
数据治理方法
文本特征向量
图像特征向量
训练语言模型
视频