摘要
本发明公开一种基于机器学习的预测分子溶剂化自由能方法,涉及计算化学技术领域,解决了分子动力学方法耗费大量的计算资源和时间的技术问题。该方法包括使用溶质分子、溶剂分子的SMILES式作为输入数据;基于RDKit工具将所述SMILES式转化为分子的一维描述符、二维描述符及三维描述符;基于开源实验数据集,通过分子的一维描述符、二维描述符及三维描述符与实验溶剂化自由能的关联关系训练机器学习模型,得到预测模型;向所述预测模型输入的溶质分子、溶剂分子的分子描述符,得到预测所述溶质分子的溶剂化自由能结果。本发明通过机器学习模型替代现有分子动力学模拟,同时采用机器学习算法和实验数据进行模型训练,提高预测结果的准确性和稳定性。
技术关键词
描述符
训练机器学习模型
分子动力学方法
策略
集成方法
主成分分析算法
训练集
芳香族化合物
深度神经网络
机器学习算法
降维方法
算术平均值
数据
表达式
随机森林
超参数
醇类
关系