摘要
本发明涉及数据处理技术领域,尤其涉及基于数智大脑的数据分析方法及系统。方法包括:通过多源数据采集途径获取目标领域内包含多个特征的样本;获取带有标签的样本数据集,并生成样本数据集的若干子空间;确定样本之间的多尺度流形距离;获取每个样本的可靠度;确定每个特征的特征重要度;基于所述特征重要度,构建随机森林模型,应用样本数据集训练随机森林模型,利用训练后的随机森林模型,对新获取到的待测数据进行分析。本发明通过确定每个特征的特征重要度,能够充分考虑不同特征对决策贡献的差异,在构建随机森林模型时,避免因低效特征的影响导致最终输出结果不准确的问题,提高了模型决策的准确性。
技术关键词
随机森林模型
数据分析方法
计算机程序指令
生成样本数据
标签
数据分析系统
金融
关系型数据库
决策
多尺度
数据处理技术
存储器
处理器
风险
逻辑
编码
疾病