摘要
本发明涉及蛋白质预测技术领域,特别涉及一种基于几何深度学习的蛋白质结合位点预测方法。本发明引入蛋白质几何描述及对应的几何图学习方案,为建模三维结构特征提供了可行途径;此外,还提出了一种RSA引导两阶段的混合迁移学习策略,首先在更大数据集上训练模型以学习通用表征,随后针对结合位点预测进行微调,从而缓解有限数据训练中的过拟合问题;本发明设计了基于密度聚类的预测后处理模块与集成学习模块,显著降低了模型在多次训练运行中的高方差。
技术关键词
标量特征
位点预测方法
描述符
并行集成学习
多层感知器
消息传递机制
编码器
学习器
邻域
代表
集成学习策略
两阶段
三维结构特征
迁移学习策略
节点特征
预训练语言模型
序列