摘要
本发明公开了一种宏基因组分箱分析环境微生物群落的优化方法,包括:收集环境微生物群落样本,提取DNA,测序生成reads,进行k‑mer特征标签计算和聚类分析;对每个样本的reads进行质控,clean reads组装生成长的contigs;将测序reads比对到contigs上生成包含每个contig reads覆盖信息的BAM文件;结合覆盖度信息和序列组成特征对每个分组内的样本集进行分箱。本发明一方面通过比较不同样本间的覆盖度模式提高分箱的准确性,有效识别污染物Contigs和嵌合bin,减少隐藏污染;另一方面通过集成多种生物信息学工具和算法,实现对环境微生物群落宏基因组数据高效、准确分析。
技术关键词
宏基因组分箱
样本
原始测序数据
聚类算法
组装工具
宏基因组数据
标签
标识符
冗余
高通量
水体
收据
序列
参数
矩阵
生物
模式
系统为您推荐了相关专利信息
反制方法
无人机飞控系统
材料特征
噪声特征
避障算法