摘要
本发明涉及一种基于迁移学习和注意力机制的蛋白质相分离倾向预测方法,包括以下步骤:获取待识别蛋白质序列;利用至少两种语言模型将所述待识别蛋白质序列转化为特征矩阵;将所述特征矩阵输入经训练的、含注意力机制的TransPS神经网络,选择注意力向量的最大值,得到蛋白质是否发生相分离的预测结果以及驱动相分离的序列区段的预测结果。与现有技术相比,本发明具有在预测准确性方面具有显著优势,能简化输入,并能同时预测相分离倾向和具体序列区段等优点。
技术关键词
识别蛋白质序列
注意力机制
矩阵
构象特征
LSTM模型
编码特征
电子设备
程序
分子
非球面
可读存储介质
存储器
处理器
数据
指令
计算机