摘要
本发明公开了一种基于图像生成数据的差分隐私数据集蒸馏方法与系统,属于数据隐私保护与机器学习技术领域。首先合成满足高斯差分隐私的合成数据集,通过在合成数据集上训练特征提取器,并使用原始数据差分隐私微调专家模型的基础上,对按类初始化的蒸馏数据集进行多轮迭代优化:每轮按类别随机选择特征提取器对齐添加噪声的原始数据与蒸馏数据的特征,并利用专家模型对齐蒸馏数据硬标签与合成数据软标签的语义;最终输出满足总隐私预算的蒸馏数据集。本发明利用生成数据提供有效先验,减少对齐过程中的额外噪声注入,不仅加速了收敛,更在相同差分隐私预算下实现了比先前方法更优的隐私保护与数据可用性权衡。
技术关键词
差分隐私
蒸馏方法
特征提取器
类别随机采样
图像
噪声
样本
标签
参数
数据隐私保护
机器学习技术
蒸馏系统
语义
匹配模块
采样率
控制模块
基础
系统为您推荐了相关专利信息
异常状态
圆盘剪
轨迹特征
形貌特征
参数优化模型
人脸图像采集方法
采集人脸图像
神经网络模型
色彩
人脸识别模块
安全监控模型
安全监控方法
识别模块
运动感知模块
安全监控系统