摘要
本发明涉及计算毒理学领域,公开了一种基于分子特征与机器学习的线粒体毒性预测方法,包括:获取对线粒体有毒或无毒的化合物数据;对采集数据集进行预处理;计算化合物的分子指纹和分子描述符,并耦合降维;将特征数据集分为训练集和测试集,构建基于树的机器学习模型和基于距离的机器学习模型,进行模型训练和基于权重集成不同类型模型;测试集数据带入模型进行预测,并评估选取最优的组合作为化合物线粒体毒性预测模型;计算线粒体毒性预测模型的应用域并对模型机理进行解释性分析。本发明可以预测小分子化合物是否具有线粒体毒性及毒性机理,相较于现有的QSAR预测方法,预测准确率和召回率更高,模型更为可靠。
技术关键词
毒性预测方法
机器学习模型
指纹
梯度提升机
描述符
数据
小分子化合物
朴素贝叶斯
随机梯度下降
机器学习算法
工作特征
支持向量机
随机森林
训练集
指标
配体
参数
混合物
单体