摘要
本发明公开了一种基于大模型驱动的多模态图学习的药靶结合亲和力预测方法,首先输入残基数为L1和长度为L2的待进行药物靶点结合亲和力预测的蛋白质序列信息和药物小分子SMILES序列信息;然后,使用ESM‑GearNet模型捕捉的蛋白质表征并结合AlphaFold预测的pdb文件共同构建蛋白质结构图,且对蛋白质序列进行分词映射操作;其次,使用RDKit工具包构建药物分子结构图,且对转换成SELFIES序列尽心分词映射操作;再次,构建GinConv和CNN的神经网络对蛋白质和药物分子的序列和结构特征进行提取并融合;最后,搭建KNN神经网络预测模型,将融合后的特征作为输入,得到药物靶点结合亲和力的预测值。本发明提高了药物靶点结合亲和力预测的效率与精确性。
技术关键词
亲和力
序列
药物
矩阵
神经网络预测模型
分子
结点
自定义函数
节点
多层感知机
融合策略
生成特征
分词
工具包
编码
字典
邻居
蛋白
因子