摘要
本发明公开了基于残基关系和序列特征的蛋白‑核酸结合位点识别方法,属于生物信息学技术领域。本发明结合ProtT5和ESM1b蛋白质语言模型提取的高维序列特征,以及ProtT5的多层注意力图信息,并融合氨基酸的物理化学性质特征,使得模型能够同时捕捉蛋白质序列及理化性质的丰富特征信息,从而显著提升对蛋白‑核酸结合位点的预测准确性和稳定性;通过Transformer架构增强序列特征的表达能力,并利用ProtT5的注意力图构建静态残基关系图,以捕捉残基间的相互作用信息;随后,采用图卷积网络(GCN)进行特征融合,并通过多层感知机(MLP)完成分类任务,使得模型能够充分融合不同来源的信息,提高蛋白‑核酸结合位点的预测性能和鲁棒性。
技术关键词
序列特征
理化特征
识别方法
位点
嵌入特征
矩阵
蛋白
多层注意力
关系
生物信息学技术
节点特征
消息传递机制
注意力机制
核酸复合物
构建预测模型
多层感知机
转移方法
系统为您推荐了相关专利信息
流量预测模型
流量预测方法
数据
交叉注意力机制
动态回归模型
多源遥感数据
多模态特征
合成孔径雷达数据
数字高程模型数据
自动识别方法
白藜芦醇
蛋白
生物信息学分析方法
机器学习算法分析
位点
棉花种质资源
农艺性状基因
混合线性模型
全基因组关联分析
标记