摘要
本申请涉及生物信息技术领域,公开了一种基于深度学习的花生蛋白质互作预测方法、系统及介质。该方法包括:通过k‑mers和Word2Vec算法对花生蛋白质序列生成词嵌入向量,与one‑hot编码、理化特征和PSSM信息拼接得到综合特征向量;根据PSSM保守性得分筛选关键位点构建特征矩阵;经多层神经网络降维压缩得到压缩特征向量;将两个蛋白质特征向量随机拼接后通过全连接层和sigmoid函数计算互作概率;根据阈值二值化分类得到花生蛋白质互作预测结果。本申请解决了现有深度学习方法无法有效融合多维度生物学特征信息并准确预测花生蛋白质互作关系的技术问题。
技术关键词
花生蛋白质
压缩特征向量
互作关系
词嵌入向量
矩阵
编码向量
序列
分类阈值
Word2Vec模型
检验标签
位点
标识符
两阶段
生物信息技术
算法
预测系统
深度学习方法
非线性
理化特征