摘要
一种基于SMOTE小样本机器学习的生物毒性预测方法,可以应对天然实验数据不足的问题,被证明能够解决复杂的环境问题,包括基于合成少数类过采样技术SMOTE生成虚拟数据,以补充样本数据和维持样本平衡来满足机器学习要求,通过天然水实验数据收集得到与预测金属毒性相关的数据:水化学条件数据,纳米金属数据,和生物积累量数据;数据预处理,以将数据转换成适合输入机器学习模型的形式而提高拟合模型的精度和效率;构建基于虚拟样本生成的小样本机器学习模型;模型验证和特征重要性分析,模型验证包括对模型进行内部和外部验证,以正确评估其稳健性和预测能力,特征重要性分析包括采用均方误差MSE增加和节点纯度增加两个标准进行特征重要性的排序。
技术关键词
生物毒性预测方法
样本
机器学习模型
过采样技术
纳米金属
变量
梯度提升机
人工神经网络
插值方法
噪声数据
无机碳
特征选择
数据分类
随机森林
误差
超参数
训练集
系统为您推荐了相关专利信息
棉花黄萎病
早期检测方法
生成对抗网络模型
网络模型训练
棉花植株
自动化涂布机
纠偏控制系统
特征值
随机森林模型
时间序列模型