摘要
本发明公开了一种基于多算法的代谢物保留时间预测方法,属于分析化学和代谢组学技术领域,通过标准品计算并筛选描述符,用于构建拟合模型并进行数据扩增。使用无监督的机器学习算法筛选特征组合,使其可以区分不同类型化合物,并作为ML模型的输入进行模型训练和验证。使用训练好的ML模型对候选化合物的保留时间进行预测,并根据预设阈值对假阳性注释结果进行排除。本发明通过利用多种ML算法实现数据扩增、特征筛选和模型训练,经过超参数优化及训练的ML模型具有较好的准确性和鲁棒性,能够对不同代谢物的RT进行预测,并对假阳性注释结果进行有效地排除。
技术关键词
描述符
时间预测方法
分子
质谱
数据
代谢组学技术
无监督
超参数
机器学习算法
同分异构
鲁棒性
训练集
喹啉
呋喃
范畴
羰基
咪唑
酰基
吡啶