摘要
本发明公开了一种海量单细胞数据的自监督聚类方法,所述方法包括如下步骤:1)从公开的基因表达数据库中下载单细胞RNA测序数据;2)对单细胞RNA‑seq数据进行预处理,包括过滤、标准化和特征选择;3)利用快速Louvain算法对预处理后的单细胞RNA测序数据进行初步聚类;4)使用“聚类代表性”这一指标从初步聚类结果中筛选出具有代表性的细胞点;5)在每个初步聚类中筛选出具有代表性的细胞点后,使用Transformer模型,得到最终的聚类结果。该方法结合快速Louvain算法和Transformer神经网络,显著提升了聚类分析的效率和准确性,为海量单细胞数据的分析提供了一种高效且精确的解决方案。
技术关键词
Louvain算法
聚类方法
矩阵
基因表达数据
高斯核函数
节点
特征选择
多头注意力机制
KNN算法
锚点
元素
社区结构
度量
标签
线性