摘要
本发明涉及数据挖掘技术领域,尤其涉及基于自适应网格的密度聚类分析方法、系统、设备及介质。方法包括:将数据空间划分为结构化网络;通过结合采样的方式,构建图结构,确保小聚类得到采样覆盖;基于采样子集结果执行第一算法,得到聚类结果。通过基于网格的自适应采样策略,本发明有效解决了传统采样方法在处理不均衡数据时忽略小聚类的问题。在不同的数据集上进行实验,结果表明该方法的采样准确性相比现有方法提升了三倍,提高了聚类准确性提高,能够更精准地揭示数据中的聚类结构。
技术关键词
聚类分析方法
网格
计算机可执行指令
采样点
密度
聚类分析系统
数据挖掘技术
处理器
采样方法
采样模块
算法
可读存储介质
网络
存储器
指标
电子设备