摘要
本方法涉及一种基于分块隐码信息重建的测序数据存储方法,可解决现有测序数据存储方法中存在的存储效率低、存储成本高以及数据查询和检索速度慢的问题,为大规模单细胞测序数据的高效存储与管理提供新策略。包括下列步骤:单细胞测序数据预处理;数据块质量评估;数据块分级原始隐码构造;原始隐码进行学习;局部数据块隐码组合全局数据块隐码;索引信息构建与数据重建。本方法能够利用经学习优化后的全局数据块隐码获取待存储数据的索引信息,基于索引信息对待存储数据进行存储,并基于索引信息对经存储的数据进行重建,无需大量真实样本参与运算即可实现单细胞测序数据的高效存储与快速检索。
技术关键词
数据存储方法
索引
代表
分块
数据预处理方法
迭代优化算法
特征选择算法
深度特征提取
基础构造
正则化参数
聚类
学习方法
模型更新
成分分析
矩阵
编码
策略
样本