摘要
本发明公开了电气化铁路供电设备在线诊断数据预处理方法及系统,获取包含n个维度的原始数据集;根据原始数据集中每个维度的数据类型,对其进行随机污染,得到随机污染数据集;拼接原始数据集与随机污染数据集构成复合数据集;采用随机森林算法为复合数据集生成重要性矩阵;基于此,对原始数据集中每个维度进行重要性评分;重复上述步骤,对原始数据集中每个维度的重要性评分累加后排序,保留评分最高的前m个维度,删除剩余n‑m个维度,得到预处理数据集;与现有方法相比,本发明具有实时性高、降维精度高、可解释性强、经济性强的优势。
技术关键词
电气化铁路供电设备
数据预处理方法
矩阵
在线
生成随机
数据预处理系统
非暂态计算机可读存储介质
随机森林
元素
处理器
模块
存储器
算法
电子设备
参数
变量
程序
系统为您推荐了相关专利信息
运动状态传感器
数据融合系统
灵敏度矩阵
流量传感器
加速度
压力传感器误差
误差标定
高低温试验箱
信号采集设备
标定方法
状态观测器
车辆主动制动
车轮角加速度
车辆系统状态
车辆纵向车速