摘要
本发明公开了一种基于全基因组测序筛选外周血中癌症特异性cfDNA片段特征组合的方法及其应用。本发明结合了多个维度的cfDNA片段信息筛选与癌症密切相关的特征指标,并提供了一项全新的评估片段长度分布特征的指标F‑Index,在癌症样本和健康样本间存在显著差异,此外本发明还应用了cfDNA片段末端6个碱基的基序特征以及基因组上10kb窗口内的cfDNA片段分布特征应用多个机器学习算法,鉴定得到一系列癌症特异性的分子特征组合,适用于对早期癌症进行风险评估和预测。基于本发明的方法筛选到的特征组合,在不同的分类模型中均有优异的预测性能,判定准确性高。
技术关键词
染色体
梯度提升机
外周血
特征值
支持向量机
分布特征
随机森林
特征选择方法
模型构建方法
样本
机器学习算法
指数
核苷酸
生成特征
频率
序列
冗余
训练集
人类
系统为您推荐了相关专利信息
储能电池寿命
时序
数据
时间卷积网络
长短期记忆网络
智能生成方法
岸桥作业
集装箱船
优化遗传算法
交叉算法
样本
焊接工艺参数
物理特征提取
焊接电流值
焊点
协方差矩阵
运动想象脑电信号
运动想象脑电数据
特征值
算术平均值