摘要
本发明公开了一种基于数据增强技术的土壤有机碳预测方法和装置,该土壤有机碳预测方法通过适量扩充与极端值相关性高的,且在安全距离范围内,即K个最近邻样本中曼哈顿距离小于等于设定的距离阈值,的样本数量,从而能够精准的对罕见且重要的样本进行扩充,在保证了训练样本的质量的同时,训练样本量也适当,从而有利于高效的训练随机森林模型,以便得到能够高精度快速预测土壤有机碳含量的土壤有机碳预测模型。
技术关键词
样本
随机森林模型
数据
土壤有机碳含量
欠采样方法
训练集
精度
预测装置
预测误差
存储器
噪声
处理器
序列
参数