摘要
本发明涉及基因鉴定技术领域,特别是涉及一种基于模型误差鉴定水平转移基因的方法,所述方法包括下列步骤:从公共数据库中获取类群蛋白数据集,并对所述类群蛋白数据集进行数据清洗,所述类群蛋白数据集中包含不同类群的多条蛋白序列;对清洗后的类群蛋白数据集中的每个蛋白进行结构预测,并基于预测结果提取多维特征向量;构建分类预测模型并采用上述多维特征向量进行训练,所述分类预测模型的输出为类群标签概率;预测待检测的蛋白序列中的蛋白结构,基于预测结果提取与训练阶段相同维度的多维特征向量,并输入训练好的分类预测模型中,根据分类预测模型的预测误差识别潜在HGT基因。
技术关键词
分类预测模型
多维特征向量
蛋白
模型误差
三维结构
序列
数据
预测误差
基因鉴定技术
软件
训练集
标签
阶段
卷曲
水性
矩阵
螺旋
频率
精度
系统为您推荐了相关专利信息
卵黄抗体
大肠杆菌高效表达
缓冲液
重组基因工程菌
ALS模型
输电线路导线覆冰
深度卷积神经网络
导线覆冰厚度
AI图像识别
系统监控平台
矢量网络分析仪
数据测试装置
非线性
模型建立方法
高低温箱
深基坑
可视化监测方法
曲面
围护墙
三次多项式模型
中药材智能
分选系统
多光谱
光谱成像
多模态数据融合