摘要
本发明公开了一种复合碱基DNA存储的多进制编码与读出方法,结合多进制纠错编码和符号映射方法,对数字信息编码并映射为包含复合碱基与标准碱基的DNA链,采用高可靠性的短分组纠错码对地址序列进行编码并添加至数据DNA序列的两端;数据读出时,利用短分组纠错码,实现测序读段的唯一地址并快速分簇,基于熵驱动的集合划分和基于最大似然的字母检测相结合,精确检测每个合成位点的原始字符,并通过纠错译码恢复原始数据。本发明利用信息熵的可分离特性,将复合碱基分集,集中字符之间的区分度变高,检测能力增强,能有效利用测序数据中的碱基频次信息,降低复合碱基检测所需的覆盖度。
技术关键词
读出方法
DNA序列
字符
信息熵
编码
二代高通量测序
纠错码
寡核苷酸
位点
引物
纠错译码算法
符号映射方法
纠错译码方法
码字
奇偶校验
纠错译码器
数据
字母
系统为您推荐了相关专利信息
变电站设备
编解码
解码矩阵
编码模块
寿命预测模型
物流仓储系统
数字孪生
仓库系统
送料系统
仓库货架