摘要
本发明公开一种用于样本数据的整合方法,涉及数据处理领域,包括:S1、依据存量数据信息,并总结筛选出明确具备某一特征变量的样本数据;S2、整合筛选出可以纳入模型的样本数据,并对样本原始数据进行初步的处理和整理,得到处理后的样本数据;S3、对S2处理后的样本数据进行数据转换,从具有S1的存量数据信息中筛选对预测未来特征变量信息有帮助的特征变量;S4、基于S3已筛选的各种特征变量,通过构建梯度提升机算法模型来进一步进行重要特征提取,使用测试集对模型进行优劣评估,从而得到最终可以对预测变量有帮助的特征变量;本发明中,通过构建特征模型,可有效提高后续的数据分析工作。
技术关键词
样本
变量
数据
梯度提升机
算法模型
决策
处理器
电子装置
存储器
指数
计算机
指标
程序
参数
系统为您推荐了相关专利信息
分类方法
集成分类器
集成策略
遗传算法
代表训练数据
门控循环单元
二维卷积神经网络
时域卷积网络
风电功率预测模型
分支
电子设备
图像处理方法
残差数据
预测残差
信息处理