针对文本分类模型的黑盒模型反演攻击方法及装置

正文

推荐专利

申请号：CN202411853090

申请日期：2024-12-16

公开号：CN119783761A

公开日期：2025-04-08

类型：发明专利

摘要

本申请涉及一种针对文本分类模型的黑盒模型反演攻击方法及装置，其中，方法包括：提取公开数据集中的文本序列开头片段，并根据文本序列开头片段构建辅助数据集；以辅助数据集中的文本序列开头片段为查询访问攻击模型，生成完整的文本序列，并对完整的文本序列打分，得到满足预设最大化条件的文本序列分数，并以满足预设最大化条件的文本序列分数为目标迭代优化攻击模型的参数，生成训练后的攻击模型；利用训练后的攻击模型生成文本序列‑分数对集合；基于文本序列‑分数对集合，筛选出大于或等于预设分数阈值的文本序列，根据文本序列生成攻击模型的最终反演攻击结果。由此，解决了黑盒场景下针对文本分类模型的模型反演攻击信息来源少、攻击难度高等问题。

技术关键词

文本分类模型序列黑盒模型参数数据计算机程序产品处理器模块可读存储介质存储器电子设备场景

针对文本分类模型的黑盒模型反演攻击方法及装置

站点导航

APP 下载