摘要
本发明公开S1、采集scRNA‑seq的基因表达矩阵,scATAC‑seq的基因活性矩阵,以及scRNA‑seq的细胞类型注释;S2、对scRNA‑seq和scATAC‑seq数据进行预处理,获取scRNA‑seq和scATAC‑seq共有的基因;S3、构建编码器网络,实现不同组学数据在共享嵌入空间中的联合表征;S4、采用scRNA‑seq数据中的细胞类型标签对嵌入空间进行监督学习引导;S5、在嵌入空间和标签空间中,采用不平衡最优传输算法对scRNA‑seq与scATAC‑seq数据进行对齐;S6、根据匹配概率矩阵为scATAC‑seq数据中的每个细胞赋予细胞类型注释,并实现scRNA‑seq数据和scATAC‑seq数据的整合。解决了现有OT框架应用于单细胞数据整合导致生物学相关信号的失真,从而影响数据整合的准确性和可靠性的问题。
技术关键词
数据整合方法
矩阵
编码器
基因
标签
样本
元素
度量
网络
参数
计算误差
偏差
算法
索引
分类器
定义
计划
因子