摘要
本申请属于生物信息学与数据挖掘技术领域,公开了一种基于粒球计算的单细胞转录组测序数据聚类方法及系统,该方法包括:对单细胞转录组测序数据进行预处理,预处理包括数据降维;基于降维后的数据构造稳定的粒球空间,粒球空间由覆盖单细胞样本的多个粒球构成;对稳定的粒球空间中的粒球进行最大粒球分裂,以进一步细化粒球集合;计算粒球间的修正距离,以构建修正距离矩阵,其中修正距离综合了粒球中心间的欧氏距离和粒球的半径信息;基于修正距离矩阵,采用密度聚类算法对粒球进行聚类,得到粒球的聚类标签;将粒球的聚类标签映射至其各自覆盖的单细胞样本,以生成最终的单细胞聚类结果。本方法实现了高效、准确且鲁棒的细胞分群。
技术关键词
单细胞转录组数据
密度聚类算法
样本
数据聚类方法
矩阵
标签
特征选择方法
数据挖掘技术
基因
聚类系统
可读存储介质
处理器
成分分析
模块
程序
指令