摘要
本说明书实施例提供了一种错误标签用户样本的识别方法及装置。原始训练集中包含用户样本,其中包含了隐私数据。在该识别方法中,首先将原始训练集中的用户样本划分到标注集和新训练集,标注集包含的用户样本具有正确的风险标签,新训练集包含原始训练集中除标注集之外的用户样本。接着,在新训练集中的每个用户样本的风险标签上增加标签修正值,得到新风险标签。使用标注集和对应的风险标签,以及新训练集和对应的新风险标签,对第二模型进行训练,在训练过程中对第二模型的模型参数和标签修正值进行更新。在第二模型训练完成后,针对标签修正值的绝对值超出阈值的用户样本,确定其具有错误标签。
技术关键词
标签
样本
风险
训练集
逻辑回归模型
识别方法
参数更新模块
识别装置
计算机
识别模块
可读存储介质
存储器
处理器
数据
算法
系统为您推荐了相关专利信息
逻辑回归分类器
掩码矩阵
掩码技术
监督学习方法
样本
拉丁超立方抽样
行星减速器壳体
变量
轴承刚度
加速度
识别模型训练方法
模型预测值
地震数据集
标签
三维地震数据体
攻击检测方法
分支
异常数据
加权最小二乘
分辨率