摘要
本发明涉及数据分析技术领域,涉及一种样本数据处理方法、装置、电子设备及存储介质。该方法包括:第一客户端从第一数据库中提取出预设数量的第一样本及对应的样本ID,根据预设的分箱算法对第一样本进行分箱,得到第一分箱结果,根据预设的箱号映射算法将第一箱号映射为第二箱号得到第二分箱结果,然后将排序索引值、样本id和第二分箱结果发送至第二客户端,以供第二客户端计算出所述第二箱号中每个箱号对应的证据权重,然后根据所述证据权重计算出所需的信息价值。本发明通过排序索引值对第二客户端的样本数据进行排序并进行累加的方式,在确保了数据安全性的前提下,提高了对WOE和IV的计算效率。
技术关键词
样本数据处理方法
分箱
客户端
索引
映射算法
样本数据处理装置
排序算法
标签
特征值
数据分析技术
电子设备
数据安全性
处理器通信
数值
标记
可读存储介质
存储器