摘要
本发明涉及生物学信息技术领域,尤其涉及一种在线整合多来源单细胞数据的方法及系统。该方法包括以下步骤:获取多源的单细胞转录组数据;对单细胞转录组数据进行基于基因表达量、线粒体基因比例以及细胞数据深度的数据质量评估,得到初始质控数据;根据初始质控数据设置标准化过滤参数,并对单细胞转录组数据进行质控参数过滤,得到过滤细胞数据;对过滤细胞数据进行基因表达特征分析,生成高变异基因表达特征数据;根据高变异基因表达特征数据进行基因表达时空分布统计,生成基因表达统计特征数据。本发明通过精细化的质控和批次效应校正,能够在保证数据质量的前提下,将不同来源的数据进行无缝整合,从而消除不同批次和技术平台带来的噪音。
技术关键词
单细胞转录组数据
基因表达特征
统计特征
差异表达基因
标记基因
差异表达分析
分布曲线数据
校正
构建基因表达
在线
富集
差异基因表达分析
矩阵
EM算法
核密度估计方法
效应
参数
贡献率
系统为您推荐了相关专利信息
分布式光纤温度
事件识别方法
最佳特征
分布式光纤传感信号
BOTDR系统
车载行驶记录仪
数据采集模块
数据存储模块
高分辨率摄像头
数据处理模块
动物模型构建方法
囊胚
基因编辑载体
胚胎干细胞系
Cre工具鼠
生成式对抗网络
异常检测方法
统计特征
日志
异常流量