摘要
一种面向单分子实时测序的基于参考基因组的组装方法,本发明涉及个体基因组组装领域,具体涉及面向单分子实时测序的基于参考基因组的组装方法。本发明的目的是为了解决单分子实时测序数据高原始错误率,以及传统从头组装计算资源和内存消耗大、难以跨越基因组中重复序列和复杂结构变异区域等问题。过程为:步骤一、基于参考基因组构建哈希索引;采用分阶段的比对策略构建长读序列的比对骨架;将长读序列的比对骨架断点记录为SV信号;步骤二、对SV信号进行聚类;步骤三、构建长读序列重叠图;将重叠图转换为有向字符串图并进行简化;将长读序列比对信息替换参考序列。
技术关键词
组装方法
气泡结构
节点
断点
分子
坐标
Dijkstra算法
信号
分阶段
索引
深度优先搜索
标识符
自定义参数
列表
有向无环图
贪心策略
重复序列