摘要
本发明公开一种DNA结合蛋白的识别方法及系统。该方法获取DBPs数据集,DBPs数据集中包含有阳性样本和阴性样本;将DBPs数据集划分为训练集和独立测试集;构建CNNCaps‑DBP模型,训练过程包括:将训练集中蛋白质序列输入至ESM C模块,用于对蛋白质序列进行编码并提取序列特征,获得蛋白质序列特征;将蛋白质序列特征输入至依次连接的两个注意力增强卷积模块中,用于捕获蛋白质序列的局部和全局信息,获得高维特征;将所述高维特征输入至胶囊网络,通过胶囊网络捕获高维特征之间的相互关系并将胶囊网络的输出输入多层感知机,获得预测结果;模型评估。本发明能够实现快速、低成本、高准确率的DBPs预测。
技术关键词
胶囊网络
序列特征
识别方法
卷积模块
多层感知机
蛋白
高级胶囊
多头注意力机制
前馈神经网络
数据
样本
分支
动态
识别系统
编码
调度器
系统为您推荐了相关专利信息
模型建模方法
鲸鱼算法
支持向量回归机
Stacking集成学习
样本
护目镜
佩戴检测方法
交叉注意力机制
嵌入特征
实例分割
图像增强方法
深度学习模型
全局特征提取
局部特征提取
模块