摘要
本发明涉及一种基于机器学习的蛋白冠上蛋白质相对丰度的预测方法及系统。所述方法包括:对各个机器学习模型进行训练评估确定一级预测器,并保存训练好的超参数和决策边界;基于超参数和决策边界以及蛋白质回归数据集进行二次训练,得到二级回归预测模型;将待预测蛋白质的特征信息输入至一级预测器中,得到分类预测结果;当分类预测结果中存在蛋白质吸附在纳米颗粒上时,将待预测蛋白质输入至二级回归预测模型,得到蛋白质相对丰度预测结果。二级回归任务是在一级分类任务的基础上进行,可减少训练时间;将分类与回归相结合可以实现对蛋白冠上蛋白质相对丰度的全面预测,提高了蛋白质相对丰度的预测性能。
技术关键词
回归预测模型
机器学习算法
纳米颗粒
梯度提升决策树
机器学习模型
超参数
蛋白
训练集
随机森林
数据
预测系统
模块
单体
基础