摘要
本发明涉及数据处理技术领域,尤其涉及一种基于大数据的消费习惯分类方法及系统。方法包括:将获取到的每个用户的包含多个维度的消费习惯数据点作为一个簇;利用数据分布建模获取各簇的分布;利用层次聚类算法获取用于反映用户消费习惯的分类结果,以实现基于大数据的消费习惯的分类,在层次聚类算法的迭代过程中,包括:将簇间W距离最小的簇合并,构建在约束条件下合并后的簇的质量向量的最小化自变量函数,确定合并后的簇的优化分布,确定簇内同质性指标,确定是否进行下一轮迭代。本发明通过以W距离衡量簇间差异,构建质量向量最小化函数,以更新合并后簇的优化分布,结合双阈值迭代分类,精准反映群体消费习惯特征。
技术关键词
层次聚类算法
分类方法
大数据
习惯
数据分布
计算机程序指令
指标
数据处理技术
分类系统
电子产品
存储器
处理器
年龄
指数
样本
参数
系统为您推荐了相关专利信息
智能胶囊
故障特征分析
故障知识库
故障信息处理方法
云端服务器
序列特征
交叉注意力机制
Softmax函数
解码器
双向信息交互
标签分类方法
特征提取网络
深度残差网络
顶点
矩阵