摘要
本发明公开了一种基于门控多模态路由的蛋白质亚细胞定位方法及系统,涉及蛋白质亚细胞定位技术领域,包括获取蛋白质图像和蛋白质序列;分别采用ConvNeXt‑V2网络和ESM‑2模型,对蛋白质图像和蛋白质序列进行特征提取,得到图像特征和序列特征,然后基于Sparsemax门控网络,得到多模态融合特征;根据STRING数据库和亚细胞区室距离矩阵,构建加权邻接矩阵,得到蛋白质图,然后结合多模态融合特征,通过定位感知神经网络,得到聚合邻居特征,再结合几何原型解码与层次约束损失,进行多标签预测,得到优化预测结果。本发明提升了对蛋白质复杂特征的捕捉能力,解决了单一模态信息不足的问题,提高了定位预测的准确性。
技术关键词
蛋白质亚细胞定位方法
序列特征
多模态特征融合
图像
矩阵
跨模态融合特征
邻居
多标签
注意力方法
模块
网络
Softmax函数
非线性
原型
通道