摘要
本申请提供了一种抵御自监督模型窃取攻击的黑盒模型水印方法、装置,存储介质及电子装置,其技术要点是获取原始模型E,并建立其对应的影子模型Es;模仿所述原始模型E对预训练集的输出结果训练所述影子模型Es;选定密钥样本K,分别将其作为所述原始模型E和所述影子模型Es的输入,将两个模型分别获得的输出结果结合,生成并获得水印m;将所述水印m嵌入所述原始模型E中获得水印模型Ewm,配置为对于携带水印的输入与对应的不携带水印的干净输入,输出结果保持相似;建立用于验证的下游可疑模型M,至少具有无需有关下游任务的先验知识,解决自监督模型受窃取攻击后在下游难以进行黑盒水印验证的技术效果。
技术关键词
黑盒模型
水印方法
数据分布
分类器模型
多层卷积神经网络
样本
图像
监督学习方法
水印装置
密钥
电子装置
水印嵌入
模块
存储器
处理器
线性
对象
计算机