摘要
本发明涉及大数据处理技术领域,特备是一种用于运营商潜客预测的销售品订购特征的向量化方法。本发明对客户的销售品订购空间的特征刻画较为全面,对比传统的稀疏矩阵表示方法有以下优势,相同特征维度下,本发明的方法能够提供更多的销售品订购信息。传统的稀疏矩阵表示方法需要的维度随着销售品数量的增长而不断增加,在训练模型的过程中将出现维度灾难。本发明的方法将全体销售品信息压缩到100维的向量中,有效控制特征数量的同时,能够保留客户名下所有销售品的订购信息。
技术关键词
Word2Vec模型
客户
大数据处理技术
指数衰减函数
词嵌入向量
更新模型参数
去重算法
序列
超参数
机器学习模型
聚类方法
插值方法
标识
网格
随机森林
特征数
输出特征
字段
样本