摘要
本发明涉及生物信息学技术领域,且公开了一种基于SNP多态性的单细胞barcode身份识别方法,选择多个基于群体遗传学分析的高变异SNP位点;采用基因组数据集成方法优化SNP位点的选择,以确保barcode的唯一性;利用机器学习算法对低丰度细胞的barcode进行噪声过滤,提高识别灵敏度;结合细胞的表型信息,采用多维度数据融合分析技术,提高barcode的多样性和准确性;在barcode序列中加入冗余信息,增强barcode的稳定性,避免条形码丢失。通过多重SNP位点组合和高变异SNP位点的选择,确保每个细胞的barcode具有高特异性和稳定性,同时通过机器学习算法提升了低丰度细胞的识别率,尤其在复杂样本中,能够精准识别并减少假阳性和假阴性的发生。
技术关键词
身份识别方法
数据集成方法
机器学习算法
SNP位点组合
条形码
生物信息学技术
遗传多样性分析
统计学习方法
深度学习网络
深度学习算法
冗余
唯一性
细胞识别
支持向量机
数据解码
重复序列