摘要
本发明公开一种基于残差网络和序列特性的蛋白质分子识别特征预测方法,首先对蛋白质序列特性进行筛选,得到四个特征集,前三个特征集分别包括多个序列特性,第四个特征集包括多个反映进化信息的序列特性;然后,对待预测蛋白质序列进行预处理,提取待预测蛋白质序列各个残基关于每个特征集的特征矩阵;最后,构建预测模型;预测模型包含四个并行分支,四个分支的输入分别是残基关于四个特征集的特征矩阵,四个分支的输出经过全连接层,得到残基是否属于分子识别特征区域;对预测模型进行训练,将训练后的预测模型用于蛋白质分子识别特征区域的预测。该方法在待预测蛋白质序列预处理过程中采用双均值计算策略,细化了特征信息的局部变化和细微差异,实现了特征信息的充分提取,显著提高了预测精度。
技术关键词
预测蛋白质序列
识别特征
残差网络
输出特征
构建预测模型
分子
分支
滑动窗口
特征值
矩阵
序列特征
指数
冗余
策略
精度