基于强化学习的多模态大模型黑盒防御方法及装置

AITNT
正文
推荐专利
基于强化学习的多模态大模型黑盒防御方法及装置
申请号:CN202411503194
申请日期:2024-10-25
公开号:CN119449397B
公开日期:2025-09-30
类型:发明专利
摘要
本发明提供了一种基于强化学习的多模态大模型黑盒防御方法及装置,具有这样的特征,包括以下步骤:步骤S1,通过图像净化器对越狱图像进行净化生成净化图像,并通过文本净化器对越狱文本进行净化生成净化文本;步骤S2,将净化文本输入良性引导生成器生成引导文本;步骤S3,将净化文本和引导文本进行拼接,得到拼接文本;步骤S4,将拼接文本和净化图像一同输入多模态大模型,生成良性回复。总之,本方法能够提高多模态大模型对越狱攻击的防御能力,并对输入生成对应的良性回复。
技术关键词
文本 多模态 净化器 大语言模型 噪声图像 净化模块 表达式 拼接模块 数据 控制权 方程 模版 参数
系统为您推荐了相关专利信息
1
一种基于检索增强提示学习的遥感图像识别方法、设备及介质
遥感图像识别方法 预训练模型 视觉 遥感图像数据 文本编码器
2
语音交互方法、服务器和计算机可读存储介质
语音交互方法 指令 槽位识别 可读存储介质 服务器
3
一种智能客服系统
智能客服系统 语义标签 画像模型 识别客户身份 账号
4
设备维护问答方法、装置、电子设备和可读存储介质
问答方法 界面 问答装置 电子设备 互联网
5
短信监测预警方法、装置、设备、介质及程序产品
监测预警方法 样本 预警规则 大语言模型 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号