摘要
本发明提供了一种分析单细胞微生物基因组测序数据的方法。该方法利用优化后的组装物种基因组序列的方法从单细胞微生物基因组中获取去除多胞污染、背景污染的物种级别的bin以及对应的物种组装结果,再根据物种SNP特征在物种级别的bin中区分出菌株级别的bin,组装后得到对应的菌株组装结果。相较于现有技术,本发明通过自动化计算组装轮数和简化流程,减少了人为干预,提高了操作的便捷性和效率;能有效控制物种bin的污染度,确保了组装结果的准确性;通过分组计算相似度矩阵,显著降低了高SAG数情况下的内存消耗,同时提高了运算速度;能够动态选择或调整相似度阈值,使其适应不同的样本类型或文库质量。
技术关键词
基因组测序数据
聚类
基因组测序文库
列表
贪婪算法
矩阵
动态
内存
样本
指标
序列
速度
系统为您推荐了相关专利信息
信息分享方法
信息交互界面
指令
计算机程序产品
讨论组
客服系统
长短期记忆网络
语音分类模型
语音语义识别
卷积神经网络特征
物流数据处理方法
物流执行系统
购物软件
物流中心
生成订单