摘要
本申请公开了一种文本生成方法、装置、设备及可读存储介质,属于人工智能技术领域。方法包括:获取目标图像;对目标图像分类,得到目标图像的分类结果,分类结果表征目标图像是否为对抗图像,对抗图像是被噪声扰动后的图像;当基于分类结果确定目标图像不为对抗图像时,获取与目标图像相关的第一目标文本;通过视觉语言模型基于目标图像和第一目标文本生成第二目标文本,第二目标文本与目标图像相关且与第一目标文本为上下文关系。当基于分类结果确定目标图像不为对抗图像时,说明目标图像未被噪声扰动,使得视觉语言模型可以基于目标图像和第一目标文本,生成准确率较高的第二目标文本,提高了视觉语言模型的安全性和可靠性。
技术关键词
图像
注意力
样本
分类器
文本生成方法
视觉
字符
执行噪声
令牌
生成提示信息
模块
电子设备
计算机程序产品
文本生成装置
答案
关系
可读存储介质
人工智能技术
系统为您推荐了相关专利信息
手术显微系统
成像单元
图像识别模块
荧光
总线系统
智能识别模块
破碎一体化装置
高分辨率摄像装置
电磁超声波
深度学习算法
三维建模数据
协方差矩阵
三维模型
注意力机制
计算机视觉