大语言模型的安全对抗测试方法、装置及电子设备

正文

推荐专利

申请号：CN202510337146

申请日期：2025-03-20

公开号：CN120297360A

公开日期：2025-07-11

类型：发明专利

摘要

本公开提供了大语言模型的安全对抗测试方法、装置及电子设备，涉及人工智能技术领域，尤其涉及深度学习、云计算、自然语言处理、大模型等技术领域。具体实现方案为：获取目标大语言模型对应的提示文本集合、对抗策略库以及对抗提示生成模型；根据提示文本集合中的原始提示文本、对抗策略库中的对抗策略以及对抗提示生成模型，生成对抗提示文本；根据对抗提示文本对目标大语言模型进行安全对抗测试；其中，结合对抗提示生成模型生成对抗提示文本，进而对目标大语言模型进行安全对抗测试，能够降低对抗提示文本的生成成本，提高对抗提示文本的生成效率，进而提高目标大语言模型的安全对抗测试效率。

技术关键词

文本大语言模型样本风险变异策略答案测试方法层级电子设备智能客服人工智能技术计算机程序产品数值场景训练装置处理器通信测试模块

系统为您推荐了相关专利信息

低代码平台收集数据的大语言模型智能分析与决策的方法

大语言模型低代码平台决策创建表单可视化界面

一种用于架空配电线路金具缺陷识别的方法及系统

架空配电线路巡检数据巡检终端金具配电网智能巡检技术

一种基于大数据的洗衣店顾客营销系统

营销方法挖掘频繁项集大数据营销系统 Apriori算法

基于在线神经网络学习的自动驾驶轨迹快速跟踪控制方法

径向基神经网络跟踪控制方法模糊推理模型预测控制器在线学习机制

小胞外囊泡miRNA及其在肺癌早期发现中的应用

早期肺癌患者序列区分肺癌检测试剂盒高风险

大语言模型的安全对抗测试方法、装置及电子设备

站点导航

APP 下载