摘要
本发明涉及一种基于孤立森林算法的交通行业数据质量异常检测方法,具体涉及交通工程领域,通过交通行业信息系统和交通行业专用终端设备分别自动捕捉静态、动态交通数据,减少人工干预并提高数据采集的效率和准确性,检查并处理交通行业数据集,根据交通行业数据集中字段取值范围判断字段类型,利用One‑Hot Encoding方法对离散型字段进行独热编码处理,通过迭代构造孤立子树组合构成孤立森林,并识别交通行业数据集的异常点,对当前静态、动态交通数据对应的异常点所在的特征进行绘制箱线图并可视化,连接领域知识图谱并结合特征和上下文信息探索导致当前静态、动态交通数据异常的原因,提高异常检测的效果和准确性,更全面地评估数据的异常性。
技术关键词
动态交通数据
孤立森林算法
异常检测方法
异常点
行业专用
静态交通
信息系统
字段
节点
终端设备
构建知识图谱
实体
编码
分支
定义
关系
系统为您推荐了相关专利信息
故障预警方法
多源异构数据
故障分析模型
特征提取模型
序列
异常检测方法
视频拍摄功能
设备回收方法
回收设备
图像
风电机组齿轮箱
状态识别方法
机械泵
DBSCAN聚类算法
皮尔逊相关系数