摘要
本申请公开一种文本对抗样本生成方法、装置、设备、存储介质及程序产品,涉及人工智能信息安全技术领域。所述方法包括获取文本数据集;选择对抗攻击方法和受害模型,根据所述文本数据集中的文本样本、对抗攻击方法和受害模型生成有效对抗样本;获取设计的提示词;选择大语言模型,利用提示词、文本数据集和有效对抗样本对所述大语言模型进行微调,得到目标语言模型;利用所述目标语言模型生成对抗样本。本发明的大语言模型具备根据提示词生成有效对抗样本的能力,且通过提示词控制攻击范围,大语言模型具备对抗样本生成的控制能力。
技术关键词
样本生成方法
大语言模型
文本
人工智能信息安全技术
数据
生成装置
微调单元
计算机程序产品
处理器
可读存储介质
存储器
指令
比率
标签
定义
系统为您推荐了相关专利信息
无人机管理终端
数据
故障原因分析
日志
滤除噪声
无功补偿设备
智能电力设备
预警模型
监测系统
实时数据
缺陷评估方法
优化极限学习机
管道环焊缝
鸟群算法
管道本体
消化系统疾病
预警系统
家用医疗检测设备
医疗信息系统
预警模块