大语言模型的安全对抗测试方法、装置及电子设备

AITNT
正文
推荐专利
大语言模型的安全对抗测试方法、装置及电子设备
申请号:CN202510337146
申请日期:2025-03-20
公开号:CN120297360A
公开日期:2025-07-11
类型:发明专利
摘要
本公开提供了大语言模型的安全对抗测试方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习、云计算、自然语言处理、大模型等技术领域。具体实现方案为:获取目标大语言模型对应的提示文本集合、对抗策略库以及对抗提示生成模型;根据提示文本集合中的原始提示文本、对抗策略库中的对抗策略以及对抗提示生成模型,生成对抗提示文本;根据对抗提示文本对目标大语言模型进行安全对抗测试;其中,结合对抗提示生成模型生成对抗提示文本,进而对目标大语言模型进行安全对抗测试,能够降低对抗提示文本的生成成本,提高对抗提示文本的生成效率,进而提高目标大语言模型的安全对抗测试效率。
技术关键词
文本 大语言模型 样本 风险 变异策略 答案 测试方法 层级 电子设备 智能客服 人工智能技术 计算机程序产品 数值 场景 训练装置 处理器通信 测试模块
系统为您推荐了相关专利信息
1
低代码平台收集数据的大语言模型智能分析与决策的方法
大语言模型 低代码平台 决策 创建表单 可视化界面
2
一种用于架空配电线路金具缺陷识别的方法及系统
架空配电线路 巡检数据 巡检终端 金具 配电网智能巡检技术
3
一种基于大数据的洗衣店顾客营销系统
营销方法 挖掘频繁项集 大数据 营销系统 Apriori算法
4
基于在线神经网络学习的自动驾驶轨迹快速跟踪控制方法
径向基神经网络 跟踪控制方法 模糊推理 模型预测控制器 在线学习机制
5
小胞外囊泡miRNA及其在肺癌早期发现中的应用
早期肺癌患者 序列 区分肺癌 检测试剂盒 高风险
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号