摘要
本公开提供了大语言模型的安全对抗测试方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习、云计算、自然语言处理、大模型等技术领域。具体实现方案为:获取目标大语言模型对应的提示文本集合、对抗策略库以及对抗提示生成模型;根据提示文本集合中的原始提示文本、对抗策略库中的对抗策略以及对抗提示生成模型,生成对抗提示文本;根据对抗提示文本对目标大语言模型进行安全对抗测试;其中,结合对抗提示生成模型生成对抗提示文本,进而对目标大语言模型进行安全对抗测试,能够降低对抗提示文本的生成成本,提高对抗提示文本的生成效率,进而提高目标大语言模型的安全对抗测试效率。
技术关键词
文本
大语言模型
样本
风险
变异策略
答案
测试方法
层级
电子设备
智能客服
人工智能技术
计算机程序产品
数值
场景
训练装置
处理器通信
测试模块
系统为您推荐了相关专利信息
大语言模型
低代码平台
决策
创建表单
可视化界面
架空配电线路
巡检数据
巡检终端
金具
配电网智能巡检技术
营销方法
挖掘频繁项集
大数据
营销系统
Apriori算法
径向基神经网络
跟踪控制方法
模糊推理
模型预测控制器
在线学习机制