摘要
本发明公开了一种基于对抗提示挖掘的文生图模型安全性提升方法及装置,方法包括:预定义若干个可优化的噪声嵌入作为优化目标,并利用最近邻搜索方法在嵌入空间中获取噪声嵌入最接近的代理嵌入,并拼接到干净嵌入的尾部,获得对抗嵌入,利用CLIP模型中的文本编码器编码对抗嵌入提取对抗提示的特征;利用图文匹配目标函数,最大化对抗提示特征与风险目标图像特征语义相似度,建立对抗提示与风险目标图像间的关联关系;在利用目标函数反向优化噪声嵌入过程中,将代理嵌入对应的梯度传递给噪声嵌入构建优化过程,实现基于梯度的噪声嵌入连续优化;优化结束后,在单词搜索空间中查询与噪声嵌入最匹配的单词,并拼接到干净提示后生成最终的对抗提示。装置包括:处理器和存储器。
技术关键词
文本分类模型
优化噪声
文本编码器
搜索方法
风险
文本分类器
处理器
图文
可读存储介质
图像
存储器
样本
程序
提升装置
指令
语义
计算机
系统为您推荐了相关专利信息
电子地图界面
三维地形模型
数据搜索方法
关键词
实时位置
综合评估系统
台账数据
综合评估方法
图像采集模块
风险识别模型
监控报警系统
车联网技术
报警管理系统
集成报警
时间窗口内分析