摘要
一种基于深度学习的噬菌体与细菌相互作用预测模型,它涉及一种噬菌体与细菌相互作用预测模型。本发明为了解决现有模型对短序列预测效果较差,无法预测未见宿主的问题。本发明包括数据预处理模块、数据形式转化模块、训练模块和预测模块;数据预处理模块,用于下载公开数据集,获得噬菌体和细菌的DNA序列以及它们相互作用关系标签,进行预处理,并划分为三个子集;特征提取模块,使用特征提取模型为每个k‑mer矩阵提取一个唯一的嵌入向量作为数据的向量化表示;训练模块,利用所提取到的向量为初始模型更新参数以实现最佳效果;预测模块,利用训练完成的模型对为待预测噬菌体预测产生相互作用的候选细菌。本发明属于宏基因组学习技术领域。
技术关键词
噬菌体
特征提取模块
特征提取模型
频率计算方法
数据
序列
矩阵
融合特征
训练集
标签
参数
关系
冗余
尺寸
种子
线性