黑盒大语言模型的安全检测方法及装置、设备、介质

正文

推荐专利

申请号：CN202510509100

申请日期：2025-04-22

公开号：CN120387169A

公开日期：2025-07-29

类型：发明专利

摘要

本申请提供了一种黑盒大语言模型的安全检测方法及装置、设备、介质，该方法包括：获取第一回答的嵌入向量和第二回答的嵌入向量；第一回答为被测的黑盒大语言模型针对攻击提示词的攻击输入返回的回复信息，第二回答为期望黑盒大语言模型返回的回复信息；基于第一回答的嵌入向量和第二回答的嵌入向量计算损失函数；若损失函数未达到预设条件，基于损失函数对攻击提示词进行优化，将优化后的攻击提示词作为下一轮循环的攻击提示词；若损失函数达到预设条件，则将本轮执行攻击提示词优化操作使用的攻击提示词作为获取的目标提示词，以利用所获取的目标提示词对黑盒大语言模型进行安全检测。本申请可以提升黑盒大语言模型安全检测的准确性和可靠性。

技术关键词

大语言模型可读存储介质处理器存储器计算机训练集电子设备语义参数模块

系统为您推荐了相关专利信息

一种海洋表面的盐度反演方法、系统、设备及存储介质

数据反演方法动态门控补丁标志位

存储服务器的性能评估方法、装置、设备、介质及产品

性能评估方法偏差标记硬盘中央处理器性能预测模型

一种基于深度学习的光疗面罩治疗方法、装置及设备

光疗面罩深度学习模型三维形变模型痤疮模式

时序检测电路、芯片、电子设备和时序检测方法

时序检测电路时序检测方法信号延时模块非临时性计算机可读存储介质

一种基于本体和大语言模型的知识图谱构建方法

知识图谱构建方法三元组实体关系面向异构数据

黑盒大语言模型的安全检测方法及装置、设备、介质

站点导航

APP 下载