抵御自监督模型窃取攻击的黑盒模型水印方法及其装置

正文

推荐专利

申请号：CN202411877842

申请日期：2024-12-19

公开号：CN119918031A

公开日期：2025-05-02

类型：发明专利

摘要

本申请提供了一种抵御自监督模型窃取攻击的黑盒模型水印方法、装置，存储介质及电子装置，其技术要点是获取原始模型E，并建立其对应的影子模型Es；模仿所述原始模型E对预训练集的输出结果训练所述影子模型Es；选定密钥样本K，分别将其作为所述原始模型E和所述影子模型Es的输入，将两个模型分别获得的输出结果结合，生成并获得水印m；将所述水印m嵌入所述原始模型E中获得水印模型Ewm，配置为对于携带水印的输入与对应的不携带水印的干净输入，输出结果保持相似；建立用于验证的下游可疑模型M，至少具有无需有关下游任务的先验知识，解决自监督模型受窃取攻击后在下游难以进行黑盒水印验证的技术效果。

技术关键词

黑盒模型水印方法数据分布分类器模型多层卷积神经网络样本图像监督学习方法水印装置密钥电子装置水印嵌入模块存储器处理器线性对象计算机

抵御自监督模型窃取攻击的黑盒模型水印方法及其装置

站点导航

APP 下载