摘要
本发明提供一种基于小样本数据融合和迁移学习的色谱保留时间预测方法。针对小分子定性数据库中已知保留时间信息的化合物少、样本稀疏等问题,本发明联合多个小样本色谱数据训练基模型,通过微调,建立小样本数据的保留时间预测模型。重点关注影响化合物保留时间的因素,包括化合物结构与色谱实验条件。为此,本发明对色谱实验条件进行编码,在化合物表示中加入色谱实验条件,限定样本(化合物)对应的色谱实验,提升保留时间预测的准确性。通过编码色谱条件和化合物表示,联合多个小样本数据集进行预训练,提升了保留时间预测的准确性,很好地辅助了小分子的定性。
技术关键词
色谱保留时间预测
Word2Vec模型
色谱柱
时间预测模型
样本
分子
描述符
深度神经网络
编码
小数据
程序
数值
指纹
训练集
节点
结点
文本
代表