基于大模型驱动的多模态图学习的药靶结合亲和力预测方法

正文

推荐专利

申请号：CN202510212593

申请日期：2025-02-25

公开号：CN120048335A

公开日期：2025-05-27

类型：发明专利

摘要

本发明公开了一种基于大模型驱动的多模态图学习的药靶结合亲和力预测方法，首先输入残基数为L1和长度为L2的待进行药物靶点结合亲和力预测的蛋白质序列信息和药物小分子SMILES序列信息；然后，使用ESM‑GearNet模型捕捉的蛋白质表征并结合AlphaFold预测的pdb文件共同构建蛋白质结构图，且对蛋白质序列进行分词映射操作；其次，使用RDKit工具包构建药物分子结构图，且对转换成SELFIES序列尽心分词映射操作；再次，构建GinConv和CNN的神经网络对蛋白质和药物分子的序列和结构特征进行提取并融合；最后，搭建KNN神经网络预测模型，将融合后的特征作为输入，得到药物靶点结合亲和力的预测值。本发明提高了药物靶点结合亲和力预测的效率与精确性。

技术关键词

亲和力序列药物矩阵神经网络预测模型分子结点自定义函数节点多层感知机融合策略生成特征分词工具包编码字典邻居蛋白因子

基于大模型驱动的多模态图学习的药靶结合亲和力预测方法

站点导航

APP 下载