摘要
一种基于差分隐私的表格生成数据脱敏方法,基于差分隐私的自适应噪声调度与稀有类别加权的扩散模型,本模型采用了一种基于差分隐私消耗的自适应噪声调度策略。当差分隐私预算消耗较高时,噪声会适当减小,从而避免生成数据质量过度下降以及有效解决生成数据的失真。此外,针对生成表格数据时,尤其是离散数据,本模型采用了基于类别频次的加权策略,对训练数据中的稀有类别赋予额外权重,通过在计算KL散度时,对每个类别的损失进行加权,以确保稀有类别的影响力得到充分考虑,确保生成数据在这些类别上的表现更为准确。
技术关键词
差分隐私
数据脱敏方法
噪声数据
连续特征
离散特征
噪声强度
训练神经网络
自动编码器
生成表格数据
特征关联分析
噪声预测模型
分类特征
样本
解码器
GAN模型
前馈神经网络
系统为您推荐了相关专利信息
电子病历数据
梯度提升模型
患者
支持向量回归
深度学习模型
客户端
差分隐私保护
联邦学习方法
服务端
随机梯度下降
分析方法
机器学习算法
数据分析模块
异常监测技术
训练神经网络模型