摘要
一种基于机器学习算法和定量构效关系的珍稀濒危生物毒性预测方法,通过机器学习算法构建毒性预测模型,能够有效评估环境污染物对珍稀濒危生物的毒性影响,为珍稀濒危生物保护及生态环境风险评估提供技术支持,其特征在于,包括步骤1,从公开数据库收集涉及珍稀濒危生物的数据和建立基于机器学习的珍稀濒危生物毒性预测数据库;步骤2,针对化学物质生成分子描述符;步骤3,数据预处理;步骤4,分别进行基于多种机器学习的珍稀濒危生物急、慢性毒性预测模型开发,并进行表现评估;步骤5,对珍稀濒危生物毒性预测模型进行内部与外部验证;步骤6,利用珍稀濒危生物毒性预测模型分析特征的重要性,找出最具影响力的特征;步骤7,结合最优机器学习模型预测污染物的毒性值。
技术关键词
生物毒性预测方法
定量构效关系
机器学习算法
描述符
广义线性模型
机器学习模型
机器学习特征
数据
数字化特征
分子
样本
指标
变量
阶段
拓扑特征
表达式
随机森林
效应
终点