摘要
本发明公开了一种宏基因组质粒识别方法、系统、终端及存储介质,涉及生物信息学DNA数据挖掘领域,所述方法包括:获取目标基因组重叠群,根据基因预测工具进行编码,得到输入特征向量,基于比对工具和预先构建的比对库,进行比对,得到基因组特征;将所述输入特征向量输入到改进的Transformer模型中,输出第一分类分数;将所述基因组特征输入到随机森林模型中,得到第二分类分数;根据基于注意力机制的分类模型,分别对所述第一分类分数和所述第二分类分数进行聚合,得到第一矩阵和第二矩阵,根据所述第一矩阵和所述第二矩阵,得到质粒识别分数。本发明通过两种模型的识别,并将对应的结果进行融合,从而可以准确识别质粒。
技术关键词
随机森林模型
质粒
注意力机制
识别方法
矩阵
基因
混合块
训练集
染色体
识别系统
可读存储介质
编码
处理器
标记
终端
序列
程序
频率
数据
系统为您推荐了相关专利信息
数字化识别方法
动态视频序列
款式分类
指纹
电数字数据处理技术
特征提取网络
特征抽取方法
文本段落
序列
前馈神经网络
涡扇发动机
低压压气机
容积
状态空间方程
高压压气机
协同控制策略
家居设备
协同控制方法
长短期记忆模型
数据