摘要
本发明公开了一种融合全局和局部信息的联合虚拟筛选方法,属于人工智能药物发现领域,包括以下步骤:首先准备待筛选靶标的活性和非活性分子的SMILES数据集以及随机分子的SMILES数据集;然后选用融合了子结构和物化属性信息的编码方式,分别训练GBDT的全局模型和局部模型;接着使用全局模型预测待筛选数据集,选取预测概率高的TopK1分子;并使用局部模型预测TopK1分子,选取TopK1分子中全局模型预测概率和局部模型预测概率的乘积高的TopK2分子;最后训练预测IC50值的GBDT的回归模型,根据预测值对TopK2分子进行重排序。本发明极大地减少了模型预测的分子数量,具有快速的筛选速度和高筛选精度,适用于小规模和超大规模的虚拟筛选,显著地降低了药物研发的成本和时间。
技术关键词
虚拟筛选方法
分子
融合全局
超参数
二分类模型
靶标
样本
数据标签
训练集
计算机存储介质
编码策略
超大规模
指纹
指标
处理器
算法
小规模
系统为您推荐了相关专利信息
条纹投影图像
包裹相位
条纹级次
结构光三维重建
相位恢复方法
模拟预测方法
集成学习方法
机器学习模型
集成训练
梯度提升决策树
水质传感器
参量测试方法
剩余使用寿命
监测矿井
零点偏移补偿
顶面结构
封装结构
半导体器件
散热材料
粘合结构
小鼠动物模型
小鼠模型
重组载体
分子生物技术
着床失败