摘要
本发明公开了一种基于域自适应的单细胞多组学数据集成方法及系统,主要解决现有技术过度整合的问题。其实现方案为:将原始的染色质可及性数据scATAC‑seq依次进行转换、标签、拼接的预处理;构建包括基于变分自编码器和模态鉴别器的无监督数据集成模型,将相对熵KL和二元交叉熵BCE作为其损失函数L,并在变分自编码器中引入域特异批归一化层DSBN;将预处理后的数据输入到无监督数据集成模型进行训练;将预处理后的数据输入到训练好的无监督数据集成模型中,得到两种不同组学数据集成为统一的低维嵌入向量。本发明在集成过程中不仅能学习到不同组学之间的同质性,还能有效保留不同组学之间的异质性,提升对大规模数据集集成的效率,可用于细胞类型标签迁移。
技术关键词
数据集成模型
编码器
数据集成方法
基因表达数据
矩阵
代表
更新网络参数
重构
标签
解码器
数据集成系统
可视化模块
特异
集成模块
线性
无监督
系统为您推荐了相关专利信息
车联网环境
推理方法
节点
加速深度神经网络
动态
语音编码器
语音翻译方法
文本翻译模型
汉语语音识别
序列
语义分割网络
三维点云数据
监测方法
图像特征点
矩阵
图像类别
特征提取模块
注意力机制
视频帧
训练样本数据