基于视频模态的多模态大语言模型越狱攻击方法

正文

推荐专利

申请号：CN202510974109

申请日期：2025-07-15

公开号：CN121037009A

公开日期：2025-11-28

类型：发明专利

摘要

本发明属于大语言模型应用技术领域，具体是基于视频模态的多模态大语言模型越狱攻击方法，包括恶意查询文本的格式化与排版视频的生成、使用视频生成模型放大视觉输入的毒性、视频帧拼接构建最终攻击视频以及输入攻击视频和提示词越狱多模态大语言模型；本发明通过视频生成模型放大恶意视觉内容，并结合图像到视频的转换技术，将静态图像的恶意信息转化为动态视频内容，利用视频帧之间的时序关联，成功绕过现有图像安全防护机制，显著提高攻击的隐蔽性和成功率，且引入视频帧拼接和精心设计的提示词，通过动态视频的形式将恶意查询扩展并加深模型的误导，增加攻击的复杂性和隐蔽性，在视频模态下表现出更强攻击效果和更高绕过成功率。

技术关键词

大语言模型视频生成模型视频编辑文本格式化视频帧字幕图像处理技术多模态排版图像生成模型动态视觉拼接方式短视频时序画面机制

基于视频模态的多模态大语言模型越狱攻击方法

站点导航

APP 下载