摘要
本发明涉及电数字数据处理技术领域,具体涉及一种基于大数据的信息收集分类系统,该系统包括存储器和处理器,处理器执行存储器存储的计算机程序,以实现如下步骤:获取待分类高维数据集,进而确定每对待分类高维数据的特征权重,利用结合特征权重的算法,对待分类高维数据集进行降维处理得到待分类低维数据集;根据待分类低维数据集中所有待分类低维数据中同一维度的数据特征变量的出现频率特征,确定每个维度的特征分类优异度,进而确定每个决策树的决策树相对深度;通过融合决策树相对深度的随机森林算法确定分类结果。本发明通过消除高维数据中冗余特征变量对数据分类结果的影响,提高了数据分类结果的准确性。
技术关键词
信息收集分类系统
变量
大数据
数据分类
电数字数据处理技术
频率
执行存储器存储
随机森林
算法
因子
直方图
冗余特征
处理器
系统为您推荐了相关专利信息
神经网络控制器
优化控制方法
变工况
优化控制目标
神经网络控制方法
酒店选址
模型建立方法
决策
分析器
构建知识图谱
智能单兵系统
智能分析模块
门控循环单元
动态权重优化
多模态数据采集
人力资源数据
大数据分析技术
Lambda架构
大数据技术
预警机制