摘要
本发明公开了一种互联网大数据信息处理系统,包括:数据采集模块:包括传感器,用于采集工业数据;数据预处理模块:用于对采集到的工业数据进行数据预处理;涉及大数据信息处理技术领域,在冗余特征去除模块,先采用皮尔逊相关系数计算相关程度,通过层次聚类或K‑均值聚类算法将特征分组,以此判断特征是否冗余,并对冗余特征进行标记,在工业数据处理过程中,针对特征之间存在的冗余特征问题进行有效处理。通过去除冗余特征和优化数据结构,减少了数据分析时占用的资源,缩短了分析时间,解决了因冗余特征导致分析过程中关注重复信息而效率低下的问题,从而提升了工业数据处理的整体效率。
技术关键词
冗余特征
互联网大数据
信息处理系统
皮尔逊相关系数
标记特征
工业数据处理
均值聚类算法
大数据信息处理技术
主成分分析降维
优化数据结构
数据采集模块
数据特征提取
信息处理方法
数据分析模块
检索算法
矩阵
变量
系统为您推荐了相关专利信息
大规模数据挖掘
神经网络参数
神经网络算法
支持向量机算法
图像处理装置执行
皮尔逊相关系数
滨海盐碱地水稻
食味品质
正则化参数
交叉验证方法
近红外漫反射光谱
面向土壤属性预测
皮尔逊相关系数
可见光
机器学习算法