摘要
本发明公开了一种基于图像生成数据的差分隐私数据集蒸馏方法与系统,属于数据隐私保护与机器学习技术领域。首先合成满足高斯差分隐私的合成数据集,通过在合成数据集上训练特征提取器,并使用原始数据差分隐私微调专家模型的基础上,对按类初始化的蒸馏数据集进行多轮迭代优化:每轮按类别随机选择特征提取器对齐添加噪声的原始数据与蒸馏数据的特征,并利用专家模型对齐蒸馏数据硬标签与合成数据软标签的语义;最终输出满足总隐私预算的蒸馏数据集。本发明利用生成数据提供有效先验,减少对齐过程中的额外噪声注入,不仅加速了收敛,更在相同差分隐私预算下实现了比先前方法更优的隐私保护与数据可用性权衡。
技术关键词
差分隐私
蒸馏方法
特征提取器
类别随机采样
图像
噪声
样本
标签
参数
数据隐私保护
机器学习技术
蒸馏系统
语义
匹配模块
采样率
控制模块
基础
系统为您推荐了相关专利信息
风险预测模型
风险预测方法
数据采集模块
深度预测模型
风险预测系统
机器人控制算法
融合方法
坐标系
高分辨率摄像头
语义标签
构件外表面
箱型钢构件
智能识别系统
超声波探头
识别模块
特高压变电站
巡检路径规划方法
无人机路径规划
无人机巡检路径
粒子群算法