摘要
本发明公开了一种水印叠加编码大片段DNA数据存储的快速读出方法,属于DNA数据存储领域。本发明首先针对水印叠加编码的大片段DNA打断后建库进行二代高通量测序,得到相应的测序数据;然后使用噪声测序读段中隐藏的水印序列与本地已知水印序列进行滑动相关计算互相关峰值;根据互相关峰值的对应位置确定读段在大片段DNA序列的位置,然后采用多数投票判决算法生成一致性序列,进而通过高效的纠错纠删除译码算法实现存储数据的可靠恢复。本发明的优势在于,支持Kb到Mb级的数据DNA长度,使用简单的滑动相关和序列共识实现读段定位,有效避免了复杂度高的从头组装,并可排除非编码DNA读段干扰,能够在较低测序覆盖度下实现原始数据无错恢复。
技术关键词
二代高通量测序
水印
读出方法
纠错码字
数据存储
编码
判决算法
滑动窗口
多线程方式
译码器
错误率
DNA序列
译码算法
标记
场景
复杂度
系统为您推荐了相关专利信息
分类存储方法
决策树分类算法
决策树模型
构建分类模型
分块存储方法
驾驶舱显示系统
气象雷达
图像存储模块
接口转换模块
扫描模块