一种基于单氨基酸序列特征的蛋白质二级结构预测方法

正文

推荐专利

申请号：CN202411106706

申请日期：2024-08-13

公开号：CN119049540B

公开日期：2025-11-18

类型：发明专利

摘要

一种基于单氨基酸序列特征的蛋白质二级结构预测方法，它属于生物信息学领域。本发明解决了由于进化信息特征获取存在局限性且模型忽略了氨基酸序列中二级结构标签之间的相互依赖关系，导致利用现有方法获得的模型预测效果不佳的问题。本发明在特征处理阶段融合了蛋白质语言模型生成的特征表示以及采用词嵌入和位置嵌入的混合编码方式得到的特征，融合的特征既含有丰富的进化信息，又充分获取了序列中氨基酸残基的位置信息以及它们之间的依赖关系。融合的特征再依次经过Transformer编码器、CNN和BiLSTM输出全局特征信息，并通过引入CRF，将序列中蛋白质二级结构之间的相互作用考虑在内，保证蛋白质二级结构预测准确率。本发明方法可以应用于蛋白质二级结构预测。

技术关键词

蛋白质二级结构 BiLSTM模型序列特征编码向量 Viterbi算法二级结构预测标签注意力编码器前馈神经网络代表训练样本集元素矩阵关系冗余阶段

系统为您推荐了相关专利信息

人体动作识别方法、装置、电子设备及存储介质

人体动作识别方法融合注意力机制人体骨架关节点路径特征

电气施工任务智能管理系统及方法

编码向量编码特征智能管理方法建筑物信息模型智能管理系统

基于知识图谱的DDoS攻击路径检测方法

路径检测方法图谱 BiLSTM模型注意力机制卷积神经网络模型

基于学习行为数据挖掘的学习成果预测方法、计算机装置

机器学习模型在线学习平台监督学习算法风险计算机装置

一种基于网络监测的光伏阵列状态监测维护方法

光伏阵列状态融合神经网络门控循环单元识别光伏时间序列特征

一种基于单氨基酸序列特征的蛋白质二级结构预测方法

站点导航

APP 下载