摘要
本发明涉及数据处理技术领域,更具体地,本发明涉及一种基于数仓底座的海量数据处理方法,该方法包括,采集数仓底座中的数据,获取每个数据的局部数据,根据每个数据的局部数据,获取每个数据的局部密度,获取每个数据的局部数据中的极值点,根据所述极值点,获取每个数据的离群程度,根据每个数据的局部密度以及离群程度,获取每个数据的特征值,根据每个数据的特征值,获取中心点;根据中心点对所有数据进行聚类,得到噪声簇;将噪声簇进行剔除,得到去噪后的数据,本发明提高了Canopy聚类算法的准确性。
技术关键词
海量数据处理方法
极值
特征值
工厂设备
代表
底座
噪声
聚类
密度
数据处理技术
电压
算法
邻域
符号
标记
系统为您推荐了相关专利信息
频率响应
超声导波
钢管混凝土构件
序列
随机森林
遥感卫星图像
去雾方法
注意力
全局平均池化
矩阵