摘要
本发明公开了一种基于集成深度学习的抗菌肽预测方法,属于生物信息领域。该方法首先从肽段结构、氨基酸残基及其理化性质等方面提取信息,然后通过三种方式(图表示、序列表示、描述符集表示)对肽进行表示。接下来,通过两种深度学习模型:图注意力网络(GAT)和门控循环单元(GRU)对肽进行特征提取,其中GAT获取肽的结构特性,GRU捕捉肽的时序特性。通过XGBoost模型和线性层以及Softmax函数进行抗菌肽的预测。最后,采用集成学习方法将多个模型的预测结果进行加权求和,得到肽段最终的预测结果。全面而深入的数据挖掘和多模型集成预测方法,使得该方法在抗菌肽预测任务上取得更准确的预测结果,从而有助于抗菌肽的快速发现和研究。
技术关键词
集成深度学习
抗菌肽
Softmax函数
预测模型训练
门控循环单元
描述符
XGBoost模型
深度学习模型
集成预测方法
集成方法
信息编码
集成学习方法
注意力
鲁棒性
序列特征
线性
节点