摘要
本发明涉及一种基于联邦学习的改良数据处理与CTR联邦推荐方法,包括以下步骤:步骤1、基于数据集样本量和正负标签比系数λ的推荐数据集的处理策略,生成的带权重的联邦推荐数据集;步骤2、基于步骤1获得的带权重的联邦推荐数据集,分别建立LR、GBDT两类联邦基线推荐模型和联邦CTR推荐模型,所述联邦CTR推荐模型包括联邦FM、联邦DeepFM模型;步骤3、基于步骤1、2所建立的数据集处理方法及联邦推荐模型,获得推荐结果。本发明能够解决如何切分原始推荐数据集来模拟真实的联邦推荐数据集的技术问题,并且能够在不泄露数据隐私和压缩模型性能的前提下,获得和集中式训练以及传统联邦推荐模型相似的模型性能。
技术关键词
客户端
GBDT模型
推荐方法
逻辑回归模型
横向联邦
样本
加密
标签
数据隐私保护
全局直方图
度度量方法
线性回归模型
更新模型参数
联邦模型
机器学习模型
矩阵
解密
编码特征