摘要
本发明提供一种基于大数据用户行为分析与画像构建方法,通过以下步骤实现:对客单价和购买次数进行对数变换、Box‑Cox转换及改进的稳健标度标准化处理,基于标准化数据创建消费密度指数,利用核密度估计构建量化关系模型并输出该指数,通过排序点聚类结构探测算法生成可达性图,确定密度空间聚类的最佳邻域半径参数和密度峰值点,采用核K‑means++算法,结合平方距离核函数和密度峰值点进行聚类,优化结果准确性,通过极端梯度提升模型计算特征权重,区分高、低消费人群;该方法有效处理数据量纲与偏态,捕捉非线性关联,优化聚类初始质心,实现对不同消费能力群体的精准识别,提升用户画像构建的准确性与业务价值。
技术关键词
画像构建方法
梯度提升模型
大数据
探测算法
空间聚类算法
指数
邻域
高斯核函数
样本
核密度估计方法
非线性
客户
关系
核心
参数
分布特征
基础