摘要
本发明公开基于计算机预测RNA‑蛋白质相互作用的方法及系统。该方法包括如下步骤:获取RPI数据并进行预处理,获得数据集;RNAErnie模型提取RNA序列特征并与RNA二级结构特征相融合,获得RNA特征;ESM2模型提取蛋白质序列特征并与蛋白质二级结构特征相融合,获得蛋白质特征;RNA特征与蛋白质特征融合,获得节点特征;构造二值化邻接矩阵;提取以RNA节点和蛋白质节点为中心的k跳封闭子图并进行节点标记;转换为线图结构,获得图拓扑特征;将节点特征和图拓扑特征输入图神经网络架构进行联合处理,输出RNA‑蛋白质相互作用的预测结果;模型评估。本发明能够实现更精确且可靠的RPI预测。
技术关键词
神经网络架构
拓扑特征
序列特征
网络模块
节点特征
多头注意力机制
计算机
数据
二级结构预测
全局结构信息
前馈神经网络
掩码策略
字符
样本
标记
噪声信息