摘要
本发明属于大语言模型应用技术领域,具体是基于视频模态的多模态大语言模型越狱攻击方法,包括恶意查询文本的格式化与排版视频的生成、使用视频生成模型放大视觉输入的毒性、视频帧拼接构建最终攻击视频以及输入攻击视频和提示词越狱多模态大语言模型;本发明通过视频生成模型放大恶意视觉内容,并结合图像到视频的转换技术,将静态图像的恶意信息转化为动态视频内容,利用视频帧之间的时序关联,成功绕过现有图像安全防护机制,显著提高攻击的隐蔽性和成功率,且引入视频帧拼接和精心设计的提示词,通过动态视频的形式将恶意查询扩展并加深模型的误导,增加攻击的复杂性和隐蔽性,在视频模态下表现出更强攻击效果和更高绕过成功率。
技术关键词
大语言模型
视频生成模型
视频编辑
文本
格式化
视频帧
字幕
图像处理技术
多模态
排版
图像生成模型
动态
视觉
拼接方式
短视频
时序
画面
机制