摘要
本发明提供了一种转录组测序数据的聚类方法及系统。应用于数据处理技术领域,所述方法包括:采集若干名患者的宫颈腺癌和癌旁组织标本,并进行数据预处理,得到标准化的基因表达矩阵;基于潜在类别模型与子联盟划分结合的聚类分析方法对所述标准化的基因表达矩阵进行聚类操作,得到聚类后的基因集合;对聚类后的基因集合进行基因功能注释,将功能注释后的聚类结果与宫颈腺癌的临床特征进行关联分析,得到基因表达与临床特征的关联性;基于聚类分析和关联分析结果,构建基于变分自编码器和Gamma混合模型的深度聚类预测模型,以预测患者预后风险或者化疗敏感性。本发明解决了高维转录组数据聚类稳定性差、预后预测精度低的问题。
技术关键词
转录组测序数据
基因表达数据
化疗敏感性预测
聚类分析方法
编码器
Gamma混合模型
样本
宫颈
Pearson相关系数
参数
患者
多层感知机
构建基因表达
分析基因表达
风险
控制基因表达
矩阵