摘要
本发明公开了一种基于蛋白质序列和相似性特征的多靶点药物设计方法,设计了由靶点特征嵌入模块、靶点特征编码模块和多靶点药物生成模块组成的多靶点药物设计模型,通过对多个靶点的特征进行独立编码和相似性编码,再根据编码后的特征潜向量和相似性特征潜向量,可以直接生成针对多个蛋白质靶点的药物分子。其中,靶点特征嵌入模块在基于ProtTrans的大型蛋白质数据集上预训练,具备较强的蛋白质特征嵌入能力;多靶点药物生成模块在大型类药物数据集上训练,获得了较强的生成药物的能力;随后,整个模型在多靶点药物数据集上训练,获得了良好的多靶点药物设计能力。设计出的药物分子可以与每个靶点蛋白良好结合,达到多靶点药物治疗的目的。
技术关键词
药物设计方法
多靶点
代表
编码模块
序列
Adam算法
多层感知机
数据
分子
sigmoid函数
设计系统
生成规则
参数
交叉注意力机制
令牌
偏差
多头注意力机制
系统为您推荐了相关专利信息
污水处理设备
特征提取模型
二分类器
周期
子模块
备件信息
时间段
时间序列分析方法
计算机可执行指令
熵权法