摘要
本发明公开了一种基于Tn5转座酶的测序数据生成方法,属于生物信息学领域。该方法包括:对于参考基因组,基于预设变异规则或变异文件生成具有特殊编码的变异单倍型序列;基于真实测序数据构建基本测序特征模型;基于Tn5转座酶特征模型生成Tn5转座酶插入后的片段序列,其中Tn5转座酶的特征模型包含相邻片段的7‑9bp重叠与碱基位点片段种类的低复杂度;基于基本测序特征模型生成带有接头的双端测序结果;基于高精度测序错误模型引入测序错误。本发明解决了现有测序数据生成方法中未模拟Tn5转座酶建库数据特征的技术缺陷,保留了真实测序数据的关键特征,为评估分析工具在Tn5类型数据集上的表现提供了数据支持。
技术关键词
Tn5转座酶
数据生成方法
噪声模型
位置映射关系
序列
拷贝数
检测工具
错误特征
染色体
核苷酸
编码
分析工具
接头
频率
复杂度
位点
解码
基准
坐标
系统为您推荐了相关专利信息
建筑外观
BIM建筑模型
图像特征点
无人机
图像拼接