摘要
本申请提供一种测序数据污染识别模型的训练方法、识别方法及电子设备;在获取原始测序数据的基础上,对原始测序数据进行质量过滤,得到初始测序数据;对初始测序数据进行特征提取,得到数据污染特征;根据数据污染特征,对初始测序数据进行筛选,得到样本测序数据;根据数据污染特征,确定目标类别污染测序数据;基于预设污染比例将样本测序数据和目标类别污染测序数据进行合并,得到第一训练测序数据;根据第一训练测序数据生成测序数据联合特征;根据测序数据联合特征对监督学习模型进行训练,得到目标监督学习模型,进而得到测序数据污染识别模型;解决了无法确定污染数据对应的微生物污染的污染类别以及测序数据被污染比例的问题。
技术关键词
监督学习模型
原始测序数据
工作特征
污染特征
分类器模型
无监督学习
神经网络模型
上下文特征
序列
自动编码器
识别方法
曲线
样本
计算机执行指令
重构误差
电子设备
处理器通信
存储器
聚类