一种融合实例和场景的自动驾驶视觉语言大模型对抗攻击方法及相关装置

正文

推荐专利

申请号：CN202510342455

申请日期：2025-03-21

公开号：CN120181185A

公开日期：2025-06-20

类型：发明专利

摘要

本发明提供了一种融合实例和场景的自动驾驶视觉语言大模型对抗攻击方法及相关装置，属于人工智能安全技术领域。本发明方法利用若干个场景级注意力图，对视觉问答数据集中的场景级图像进行场景级干扰，得到一个被干扰文本攻击的场景级图像，所述场景级干扰指的是对场景级图像进行全局对抗干扰。将若干个实例级图像、一个被干扰文本攻击的场景级图像、一个场景级图像对应的若干个增强文本在特征空间中进行交互融合，得到一个场景级的对抗样本图像。与现有技术相比，本发明解决了自动驾驶中多模态交互攻击的成功率不高的问题。

技术关键词

图像文本注意力视觉数据获取模块生成场景样本处理器算法存储器物体检测器电子设备语义

系统为您推荐了相关专利信息

地物目标语义分割方法和相关产品

语义分割模型像素点语义分割方法样本通信接口

作物的垄行范围确定方法、程序产品、电子设备及介质

像素点计算机程序指令机器学习法线条无人机

一种多模态抑郁检测方法、系统、介质及设备

交互特征多模态特征多头注意力机制多模态交互抑郁检测系统

基于连续小波变换和botnet的水下波长尺度声散射物体的分类识别方法

连续小波变换分类识别方法卷积神经网络方法全局结构信息特征融合方法

一种多组分数字岩心重构方法、装置、设备及介质

生成对抗网络模型数字岩心重构方法多组分结构岩心图像样本

一种融合实例和场景的自动驾驶视觉语言大模型对抗攻击方法及相关装置

站点导航

APP 下载