一种用于多模态大模型的越狱攻击测试方法

正文

推荐专利

一种用于多模态大模型的越狱攻击测试方法

申请号：CN202510245745

申请日期：2025-03-04

公开号：CN119740229B

公开日期：2025-09-23

类型：发明专利

摘要

本发明涉及一种用于多模态大模型的越狱攻击测试方法，首先基于各个预设恶意提示文本，获得各个恶意提示最优文本；然后以获得各恶意提示最优文本所对应恶意提示文本分别关于目标多模态大语言模型的生成结果，以及基于各恶意提示最优文本，构建各恶意提示测试文本；最后由各恶意提示测试文本分别与对应关于目标多模态大语言模型的生成结果进行组合，构成各恶意测试用例，完成了对目标多模态大语言模型的自动化越狱攻击测试，设计方案通过优化恶意测试用例的生成，提高恶意测试用例的相关性和语义准确性，进而提高越狱攻击的成功率，并增强攻击的多样性和适应性，以此评估和改进多模态大语言模型的安全性，提高多模态大语言模型的安全性和鲁棒性。

技术关键词

大语言模型攻击测试方法多模态生成结构强化学习模型策略文本识别模型对象内容更新信息更新同义词鲁棒性重构语义冗余音频视频图像

系统为您推荐了相关专利信息

数据分析方法、装置及相关产品

数据分析方法大语言模型样本生成图表广告营销技术

一种多源数据融合的智慧农业知识图谱构建系统及方法

农作物生长状态标识解析技术知识图谱构建构建系统数据安全监测

一种构建基于事理知识图谱和多智能体的工业异常检测及决策系统的方法

事理知识图谱决策系统多模态大语言模型日志

基于模态不变特征学习的缺失多模态船舶分类识别方法

分类识别模型分类识别方法可见光图像多模态特征提取模块

车辆控制方法、服务器和计算机可读存储介质

大语言模型车辆控制方法指令组可读存储介质服务器

一种用于多模态大模型的越狱攻击测试方法

站点导航

APP 下载