摘要
本说明书实施例公开了一种fastq文件的测序数据拆分方法。本说明书实施例的方法包括:接收并解析fastq文件,获得包含依次排序的barcode 1序列、W1序列、barcode 2序列、UMI序列、Poly T序列/TSO序列的read 1数据;依次从read 1数据中定位W1序列、barcode 2序列、UMI序列、Poly T序列/TSO序列在read 1数据中的位置信息和序列结构;获取read 1数据的前10bp序列为barcode 1序列的节选序列,进行白名单匹配;将barcode 2序列与白名单匹配,当上述两个序列均匹配成功时,该read 1数据为有效read 1数据。
技术关键词
序列
白名单
数据拆分方法
基因
汉明距离
总量
算法
平台
样本
依序
定义
系统为您推荐了相关专利信息
剩余寿命评估方法
牺牲阳极块
参比电极
剩余使用寿命
电流传感器
温控管理系统
二维码管理
序列检测
温度检测模块
溯源管理系统
设备运行参数
动态调度算法
分布式大数据处理
多层次分析方法
分层存储结构