摘要
本发明公开了工业互联网大数据快速聚类方法及系统,首先对原始数据集进行聚类,计算各聚类结果的中心点作为代表点,形成代表点集合;随后,计算每个代表点的局部密度及其近邻关系,构建相关性权重矩阵,并基于该矩阵生成位置调整矩阵,优化代表点的空间分布以强化聚类结构;继而基于边界相似度对调整后的代表点进行层次聚类,逐步合并相似度最高的两个数据簇,直至数据簇数量达到预设阈值;最后,根据原始数据样本与各数据簇内代表点的欧式距离,为原始数据样本分配类别标签,实现原始数据集的聚类分析。本发明能够在保证聚类精度的同时,提升大数据环境下的聚类速度和计算效率,为工业互联网数据的挖掘与利用提供了具有实用价值的解决方案。
技术关键词
工业互联网
聚类方法
代表
大数据
矩阵
聚类系统
聚类算法
样本
初始聚类中心
关系
密度
度量
模块
标签
元素
精度
参数
系统为您推荐了相关专利信息
网络异常检测方法
代表
空间拓扑关系
前馈神经网络
变量
监测点
周期管理方法
混凝土构件
内填混凝土
BIM建模软件