基于蒙特卡洛树搜索算法的大语言模型语音漏洞测试方法、设备、介质

正文

推荐专利

申请号：CN202411897449

申请日期：2024-12-23

公开号：CN119830298A

公开日期：2025-04-15

类型：发明专利

摘要

本发明公开了一种基于蒙特卡洛树搜索算法的大语言模型语音漏洞测试方法、设备、介质，包括：获取若干场景模板作为种子池，将AdvBench数据集中的样本作为有害问题；基于蒙特卡洛树搜索算法从种子池中筛选得到能够攻击成功的场景模板作为越狱模板；对筛选得到的越狱模板进行若干变异操作，将有害问题插入至变异后的越狱模板中；将变异后的越狱模板以及有害问题转换为语音模态，将语音模态输入至大语言模型中，得到模型响应；通过预先训练好的判断模型判断所述模型响应为拒绝或合规；当模型响应为拒绝时，则大语言模型不存在安全漏洞；当模型响应为合规时，则大语言模型存在安全漏洞。

技术关键词

漏洞测试方法蒙特卡洛树搜索算法模板语音种子场景节点表达式处理器训练集计算机程序产品存储器阶段可读存储介质数据标签样本电子设备

系统为您推荐了相关专利信息

基于强化学习的四叉树自适应构建方法

强化学习框架强化学习模型深度Q网络节点广度优先搜索算法

一种适用于电动自行车的故障智能感应预警系统

电路故障诊断断控制单元自行车充电器预警系统信息发送单元

复杂结构试验数据分析方法及系统

数据分析模型数据分析方法数据分析系统模板超参数

基于人工智能数字人自然语言交互技术的访客机系统

访客自助自然语言交互技术大语言模型数据存储单元

一种基于大语言模型的数据库异常诊断方法及系统

大语言模型识别异常信息搜索算法诊断方法聚类

基于蒙特卡洛树搜索算法的大语言模型语音漏洞测试方法、设备、介质

站点导航

APP 下载