摘要
本发明公开了一种多视图图嵌入融合的蛋白质‑DNA结合位点预测方法EGPDI,利用蛋白质结构生成模型AlphaFold2获取蛋白质结构,整合蛋白质序列构成数据集;将蛋白质‑DNA结合位点问题转换为图节点分类问题;使用预训练的蛋白质语言模型(pLMs)生成嵌入和手工设计的特征共同构成图的节点特征编码;基于蛋白质的3D结构信息设计图的边特征编码;采用等变图神经网络和图卷积网络从不同的视图角度捕获信息;使用搭建的EGPDI模型对数据集进行预测,并采用Grid Search超参数优化对模型进行参数优化;采用五折交叉验证的评估方式对模型性能进行评估,使用特异性、精确率、召回率、F1‑score和马修斯相关系数,五个评估指标衡量模型;采用独立测试和案例分析进行模型泛化能力的验证,相比于最先进的方法,EGPDI有了显著的性能提升。
技术关键词
位点预测方法
节点特征
隐马尔可夫模型
多头注意力机制
融合蛋白质
序列
多层感知机
编码方案
样本
矩阵
网络
指标
高性能
数据
两点
参数
手工
系统为您推荐了相关专利信息
趋势预测方法
消息传递机制
水文
动态贝叶斯网络
协同克里金
缺失值填补方法
直流矿热炉
状态空间模型
母线
特征提取模块
交互注意力
交互特征
序列特征
卷积神经网络模块
靶标相互作用
智能安防管理系统
风险
子模块
隐马尔可夫模型
指标