摘要
本公开提供了一种用户样本数据的处理方法、装置、电子设备和介质,涉及数据处理技术领域,尤其涉及数据筛选和数据聚类技术领域。实现方案为:获取电商平台的初始样本用户组,其中,初始样本用户组中的每个样本用户包括与电商平台的对照实验的自变量相关联的多个待处理用户特征和与对照实验的因变量关联的结果特征;使用预训练的随机森林算法模型处理初始样本用户组,得到多个特征重要性排序结果;根据多个特征重要性排序结果,从多个待处理用户特征中筛选出多个目标用户特征;基于多个目标用户特征,从初始样本用户组中筛选出特征相似度高于预设阈值的多个样本用户加入目标样本用户组;以及基于目标样本用户组进行对照实验。
技术关键词
样本
算法模型
随机森林
电商
画像特征
数据聚类技术
时间段
平台
逻辑回归模型
主成分分析法
电子设备
数据处理技术
计算机程序产品
处理器通信
指令
模块
可读存储介质
系统为您推荐了相关专利信息
智慧运维系统
数字孪生模型
变电站三维模型
数据管理模块
设备组件
日志异常检测方法
序列
语义特征
数据处理模块
注意力
运输工具
物流大数据
三维网格单元
数据存储单元
数据采集单元