摘要
本发明公布了一种综合考虑距离和密度的k‑means初始聚类中心确定方法,进而规避传统算法迭代次数多、时间性能差且容易陷入局部最优的不足。首先,根据数据样本集设定邻域值和最小密度系数阈值,并计算任意两个样本点之间的欧式距离;其次,计算各样本点的密度系数,删除密度系数小于最小密度系数阈值的低密度样本点,得到高密度点集合,并基于该集合确定初始聚类中心;然后,遍历样本集,找到距离每个样本点最近的聚类中心,将样本集划分为k簇,同时分别计算每簇所有数据的中心点,获得新的k个聚类中心;最后进行收敛判定。本发明综合考虑密度、距离两个参考量来选择初始聚类中心,使得聚类中心在选取上更为合理。
技术关键词
初始聚类中心
样本
居民用电数据
邻域
计算方法
空调用电量
计算机设备
可读存储介质
处理器
低密度
洗衣机
电视机
存储器
高密度
算法
系统为您推荐了相关专利信息
多模型协同
三维模型
大功率变压器
缺陷识别方法
绝缘
功能模块
深度学习模型
意图识别
数据生成方法
样本