基于遗传算法与注意力分布的大语言模型安全漏洞测试方法、设备、介质

AITNT
正文
推荐专利
基于遗传算法与注意力分布的大语言模型安全漏洞测试方法、设备、介质
申请号:CN202411968410
申请日期:2024-12-30
公开号:CN120086852A
公开日期:2025-06-03
类型:发明专利
摘要
本发明公开了一种基于遗传算法与注意力分布的大语言模型安全漏洞测试方法、设备、介质,包括:选取AdvBench数据集作为漏洞测试问题;对AdvBench数据集中的一测试问题样本进行恶意词汇提取与词元分解;随机选取若干个词元作为初始种群,计算并放大选取的词元对应的注意力得分;对初始种群按照变异概率进行编码翻转,从而对种群进行优化;将优化后的种群对应的测试问题输入至大语言模型,对模型响应进行判定;当模型响应为拒绝时,则大语言模型不存在安全漏洞;当模型响应为合规时,则大语言模型存在安全漏洞。
技术关键词
遗传算法 测试方法 注意力 样本 表达式 人工智能模型 种子 编码 数据 处理器 语句 计算机程序产品 矩阵 漏洞 存储器 自然语言 可读存储介质 索引 交叉点
系统为您推荐了相关专利信息
1
一种基于人工智能的物理沉积模拟实验设计规划方法
设计规划方法 沉积模拟实验 参数 机器学习模型 气候
2
一种基于规划大语言模型的数据到文本的生成方法
大语言模型 规划 文本生成方法 数据 三元组
3
一种眼疾预测方法、装置、电子设备及可读存储介质
眼疾 光学相干断层成像 图像训练样本 网络 融合特征
4
一种多模型过程敏感性分析方法、存储介质、设备
敏感性分析方法 多模型 蒙特卡洛算法 嵌套结构 参数
5
一种基于强化学习的生物分子可合成性评估方法及装置
分子 数据 性评估方法 生物 多模态特征融合
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号