摘要
本发明提供了一种基于ESM‑2和双路径神经网络的DNA结合蛋白和RNA结合蛋白分类方法,具体表现为将ESM‑2与双路径神经网络相结合的分阶段分类方法,称为DRBP‑EDP;在第一阶段训练中,将蛋白质序列分类为核酸结合蛋白或非核酸结合蛋白;在第二阶段训练中,进一步将核酸结合蛋白分类为DNA结合蛋白或RNA结合蛋白;同时,本发明还构建了精细的数据集构建方法,从而创建了高质量的蛋白质分类数据集,通过这种方法,DRBP‑EDP模型取得了很好的性能,第一阶段对核酸结合蛋白和非核酸结合蛋白的分类准确率为90.03%,第二阶段对DNA结合蛋白和RNA结合蛋白的分类准确率为89.56%,不仅为蛋白质分类提出了新的见解和方法,还为研究蛋白质功能提供了创新工具,从而为生命科学的发展提供了新的机遇。
技术关键词
分类方法
核酸
多头注意力机制
Attention机制
蛋白质序列变体
研究蛋白质功能
分类准确率
数据集构建方法
编码器
前馈神经网络
分阶段
标记
数据校正
超参数
训练集
策略
关系
系统为您推荐了相关专利信息
安全监管方法
商城
分布式特征
安全监管系统
差分隐私保护
图像分类方法
空间特征提取
光谱特征提取
高光谱图像分类
像素
产地识别方法
数字高程数据
影像
全色波段
解耦算法