海量单细胞数据的自监督聚类方法

正文

推荐专利

海量单细胞数据的自监督聚类方法

申请号：CN202510007237

申请日期：2025-01-03

公开号：CN119397309B

公开日期：2025-04-18

类型：发明专利

摘要

本发明公开了一种海量单细胞数据的自监督聚类方法，所述方法包括如下步骤：1）从公开的基因表达数据库中下载单细胞RNA测序数据；2）对单细胞RNA‑seq数据进行预处理，包括过滤、标准化和特征选择；3）利用快速Louvain算法对预处理后的单细胞RNA测序数据进行初步聚类；4）使用“聚类代表性”这一指标从初步聚类结果中筛选出具有代表性的细胞点；5）在每个初步聚类中筛选出具有代表性的细胞点后，使用Transformer模型，得到最终的聚类结果。该方法结合快速Louvain算法和Transformer神经网络，显著提升了聚类分析的效率和准确性，为海量单细胞数据的分析提供了一种高效且精确的解决方案。

技术关键词

Louvain算法聚类方法矩阵基因表达数据高斯核函数节点特征选择多头注意力机制 KNN算法锚点元素社区结构度量标签线性

海量单细胞数据的自监督聚类方法

站点导航

APP 下载