摘要
本发明属于对抗样本自适应生成技术领域,公开了一种面向中文文本的对抗样本自适应生成方法及系统,本发明首先设计新的关键词定位算法,其次根据中文特征设计多种不同的替换策略,最后通过模型自适应地选择替换策略以减小扰动次数提高扰动效率。通过设计新的对抗样本方法解决目前中文对抗样本研究存在的问题,提升对抗样本攻击的成功率与攻击效率。通过对对抗样本攻击的研究深入挖掘基于文本的人工智能模型以至于大模型的安全隐患以设计更好的防御措施,提升人工智能模型安全可控的落地。可以生成更加有效的中文对抗样本。设计自适应攻击以保证生成的对抗样本具有很小的修改率,同时具有相当高的攻击效果。
技术关键词
面向中文文本
关键词
词语
生成方法
样本
信息数据处理终端
词典
人工智能模型
同义词
生成系统
深度学习模型训练
构建分类模型
策略
中文特征
计算机设备
拼音
常用汉字