摘要
一种基于扩散模型的蛋白质构象系综建模方法,首先,提取蛋白质在原子级、残基级及整体拓扑结构上的关键特征,并将其输入基于图神经网络GNN的扩散模型中进行学习;在去噪过程中,引入Modeller算法对生成的构象进行物理修正,以确保其合理性和生物学可信度;随后,通过循环迭代优化,不断生成符合物理约束的蛋白质构象系综,从而精准捕捉蛋白质的动态行为和功能构象变化,为结构生物学、蛋白质工程及药物设计提供更加可靠的建模方法。本发明通过深入挖掘蛋白质静态数据库PDB中隐含的动态信息,并结合大语言模型解析蛋白质氨基酸序列所蕴含的多种构象特征,从而实现对蛋白质结构多样性的精准建模。
技术关键词
建模方法
大语言模型
构象特征
物理
选取结构
序列
优化器
裁剪结构
制作标签
节点特征
折叠结构
传播算法
网络架构
参数
噪声
动态
唯一性
负电荷