摘要
本发明公开了一种工业互联网大数据中异常数据挖掘方法及系统,包括:步骤1.计算数据集中每个样本的互k近邻集合 MkNN;步骤2.基于所述MkNN集合计算每个样本的变化分数 VS;步骤3.计算每个样本到其k近邻的最大距离作为隔离分数 IS;步骤4.基于所述变化分数 VS 与隔离分数 IS计算得到局部变化度 LVD;步骤5.选取LVD值最大的样本进行类别标注,并将该样本及其k近邻的LVD值置为无效;步骤6.重复步骤5直至满足迭代终止条件,输出标注的异常数据集合。本发明通过引入局部变化度,能够充分利用局部数据分布的突变定位异常区域,并显著减少了发现数据集中全部异常数据所需要的问询次数,从而提升工业互联网大数据中异常数据挖掘的效率和准确率。
技术关键词
工业互联网
大数据
聚类方法
样本
数据挖掘方法
数据挖掘系统
异常数据
分区
直方图
数据分布
输出模块
参数
标签
矩阵
元素
系统为您推荐了相关专利信息
企业运营管理系统
系统监控模块
频繁模式增长算法
分析模块
数据采集模块
特高压变电站
巡检路径规划方法
无人机路径规划
无人机巡检路径
粒子群算法
指标
训练算法
对抗网络模型
学习算法
自动编码器
能耗预测方法
能耗预测模型
相关系数算法
变量
多功能智能电表
交通流预测方法
卷积模块
数据
离散小波变换
节点