摘要
本发明涉及胃癌基因突变图谱构建方法技术领域,具体公开了一种基于机器学习的胃癌基因突变图谱构建方法,包括以下步骤:步骤S1,收集各种人类癌症的各种测序数据的公开数据集TCGA(Thecancergenomeatlas,癌症基因组图谱);步骤S2,选定TCGA‑STAD项目中,排除囊性、黏液性和浆液性肿瘤外的剩余的腺瘤和腺癌患者的基因数据;步骤S3,随后经全转录组测序(RNA‑Seq)实验,得到基因表达量化的测序数据,还获取了患者的临床数据;步骤;本发明中,对胃癌基因表达数据进行深入分析,研究首先对数据集进行探索和筛选,然后利用差异分析、富集分析等统计数据分析方法确定关键基因突变点,进而实现胃癌亚型的分类和胃癌基因突变图谱的构建。
技术关键词
图谱构建方法
胃癌
统计数据分析方法
转录组测序
方差稳定变换
基因表达数据
样本
无监督聚类
随机森林模型
患者
预训练模型
训练集
黏液
肿瘤
矩阵
代表