摘要
本发明公开了一种基于虚拟原子和距离层次学习的蛋白质功能预测方法,包括数据预处理,虚拟原子初始化,定义关系集,所有原子经过嵌入层得到初始隐藏状态,采样一个均匀分布作为关系聚合的权重概率系数,根据权重系数采用基于关系集的消息聚合网络先后进行真实原子和虚拟原子的K轮特征更新,以代表蛋白质的虚拟原子作为球心构建若干等距离阈值的同心球,为每个同心球内的原子进行加权求和池化并进行归一化得到蛋白质表示,将蛋白质表示输入两层前馈网络和一层softmax层进行分类输出。本申请对蛋白质中的非共价键作用进行了建模,加强了网络对空间结构的感知,有效提高了蛋白质功能预测的准确性。
技术关键词
蛋白质功能预测方法
关系
矩阵
编码
消息
预测模型训练
网络
序列
共价键
定义
多层感知机
节点特征
空间结构
工具包
样本
两阶段
代表
参数
坐标系