摘要
本发明公开了基于传递邻居的糖尿病异常数据检测方法,包括:S1、使用自然邻居搜索算法自适应确定糖尿病数据集的最少数据对象个数参数;S2、计算所有糖尿病数据对象到其第MinPts个邻居的距离,绘制距离降序曲线,根据曲线拐点确定邻域半径参数;S3、使用所述参数执行DBSCAN聚类算法,获取糖尿病数据的边界点和噪声点作为候选离群点;S4、为候选离群点构建传递邻居域,包括从目标糖尿病数据对象开始迭代标记最近邻形成传递链;S5、通过加权求和公式计算传递离群因子;S6、根据传递离群因子排序输出糖尿病数据中的离群点。本发明用于高效识别糖尿病数据中的异常对象。
技术关键词
异常数据检测方法
邻居搜索算法
DBSCAN聚类算法
离群点
代表
因子
异常对象
曲线
参数
跨度
密度
核心
噪声
邻域
标记