摘要
本申请涉及一种针对文本分类模型的黑盒模型反演攻击方法及装置,其中,方法包括:提取公开数据集中的文本序列开头片段,并根据文本序列开头片段构建辅助数据集;以辅助数据集中的文本序列开头片段为查询访问攻击模型,生成完整的文本序列,并对完整的文本序列打分,得到满足预设最大化条件的文本序列分数,并以满足预设最大化条件的文本序列分数为目标迭代优化攻击模型的参数,生成训练后的攻击模型;利用训练后的攻击模型生成文本序列‑分数对集合;基于文本序列‑分数对集合,筛选出大于或等于预设分数阈值的文本序列,根据文本序列生成攻击模型的最终反演攻击结果。由此,解决了黑盒场景下针对文本分类模型的模型反演攻击信息来源少、攻击难度高等问题。
技术关键词
文本分类模型
序列
黑盒模型
参数
数据
计算机程序产品
处理器
模块
可读存储介质
存储器
电子设备
场景