摘要
本发明公开了一种蛋白质配体相互作用多任务预测方法:使用Rostlab公开的prot_bert蛋白质预训练模型表示获得蛋白质的表示向量;使用transformer的encoder结构编码SMILES,获得SMILES的表示向量;使用交叉注意力处理蛋白质的表示向量和SMILES的表示向量,提取蛋白质与小分子的交互向量;将包含蛋白质与小分子交互信息的向量分别传入一个线性分类网络和一个线性回归网络得到输入蛋白质与小分子的相互作用预测结果,本发明采用共享特征表示提高数据效率,减少过拟合风险,使用课程学习的思想定义不同任务的训练顺序,促进模型收敛,节约计算资源,提高预测准确度,为亲和力预测任务提供了一个可靠稳健的方法。减少盲目的试验工作,节省药物研发的时间和成本。
技术关键词
多任务预测方法
配体相互作用
分类网络
课程学习方法
bert模型
线性
注意力
分子
亲和力
编码
资源共享
序列
风险
模块
数据
误差
定义
药物
关系
系统为您推荐了相关专利信息
车道线检测方法
注意力机制
图像采集装置
分类网络
车道线检测系统
哈希检索方法
报告
跨模态
特征提取网络
图像编码器
图像分类方法
图像分类网络
图像生成网络
局部特征提取
生成对抗网络