摘要
本发明涉及一种基于预训练蛋白质语言模型和集成深度学习的蛋白质内在无序区域预测方法。本发明基于预训练蛋白质语言模型,构建了蛋白质序列的通用特征,结合不同的深度神经网络,捕获蛋白质中长无序区域和短无序区域的特性,并通过集成三个特定的深度学习模型构建了蛋白质内在无序区域的预测方法。本发明提出的预测方法不仅通过深度学习方法能够获得蛋白质的通用表达,也可以学习蛋白质序列中氨基酸残基的局部上下文特征和远距离的依存关系,通过集成学习方法,融合了三个互补的预测器,大幅度提高了固有无序蛋白质的预测性能;此方法可快速准确地识别固有无序蛋白质,成本低,可行性强,便于使用和推广。
技术关键词
区域预测方法
通用特征
特征提取模块
识别蛋白质序列
上下文特征
深度神经网络
sigmoid函数
集成深度学习
集成学习方法
训练语言模型
训练集
门控循环单元
深度学习方法
深度学习模型
预训练模型
远距离
标记
注意力机制
矩阵
系统为您推荐了相关专利信息
分辨率方法
语义特征
特征提取模块
网络恢复
影像
网络安全知识图谱
电力
评分系统
神经网络模型
代表
环境声音分类
跨层连接结构
网络模块
超参数
进化算法
Stacking集成模型
静脉血栓栓塞
风险预测方法
无序分类变量
随机森林
面源污染负荷模型
SWAT模型
水文
农业管理措施
时空分布特征