基于遗传算法与注意力分布的大语言模型安全漏洞测试方法、设备、介质

正文

推荐专利

申请号：CN202411968410

申请日期：2024-12-30

公开号：CN120086852A

公开日期：2025-06-03

类型：发明专利

摘要

本发明公开了一种基于遗传算法与注意力分布的大语言模型安全漏洞测试方法、设备、介质，包括：选取AdvBench数据集作为漏洞测试问题；对AdvBench数据集中的一测试问题样本进行恶意词汇提取与词元分解；随机选取若干个词元作为初始种群，计算并放大选取的词元对应的注意力得分；对初始种群按照变异概率进行编码翻转，从而对种群进行优化；将优化后的种群对应的测试问题输入至大语言模型，对模型响应进行判定；当模型响应为拒绝时，则大语言模型不存在安全漏洞；当模型响应为合规时，则大语言模型存在安全漏洞。

技术关键词

遗传算法测试方法注意力样本表达式人工智能模型种子编码数据处理器语句计算机程序产品矩阵漏洞存储器自然语言可读存储介质索引交叉点

系统为您推荐了相关专利信息

一种基于人工智能的物理沉积模拟实验设计规划方法

设计规划方法沉积模拟实验参数机器学习模型气候

一种基于规划大语言模型的数据到文本的生成方法

大语言模型规划文本生成方法数据三元组

一种眼疾预测方法、装置、电子设备及可读存储介质

眼疾光学相干断层成像图像训练样本网络融合特征

一种多模型过程敏感性分析方法、存储介质、设备

敏感性分析方法多模型蒙特卡洛算法嵌套结构参数

一种基于强化学习的生物分子可合成性评估方法及装置

分子数据性评估方法生物多模态特征融合

基于遗传算法与注意力分布的大语言模型安全漏洞测试方法、设备、介质

站点导航

APP 下载