基于强化学习的多模态大模型黑盒防御方法及装置

正文

推荐专利

申请号：CN202411503194

申请日期：2024-10-25

公开号：CN119449397B

公开日期：2025-09-30

类型：发明专利

摘要

本发明提供了一种基于强化学习的多模态大模型黑盒防御方法及装置，具有这样的特征，包括以下步骤：步骤S1，通过图像净化器对越狱图像进行净化生成净化图像，并通过文本净化器对越狱文本进行净化生成净化文本；步骤S2，将净化文本输入良性引导生成器生成引导文本；步骤S3，将净化文本和引导文本进行拼接，得到拼接文本；步骤S4，将拼接文本和净化图像一同输入多模态大模型，生成良性回复。总之，本方法能够提高多模态大模型对越狱攻击的防御能力，并对输入生成对应的良性回复。

技术关键词

文本多模态净化器大语言模型噪声图像净化模块表达式拼接模块数据控制权方程模版参数

系统为您推荐了相关专利信息

一种基于检索增强提示学习的遥感图像识别方法、设备及介质

遥感图像识别方法预训练模型视觉遥感图像数据文本编码器

语音交互方法、服务器和计算机可读存储介质

语音交互方法指令槽位识别可读存储介质服务器

一种智能客服系统

智能客服系统语义标签画像模型识别客户身份账号

设备维护问答方法、装置、电子设备和可读存储介质

问答方法界面问答装置电子设备互联网

短信监测预警方法、装置、设备、介质及程序产品

监测预警方法样本预警规则大语言模型标签

基于强化学习的多模态大模型黑盒防御方法及装置

站点导航

APP 下载