摘要
本发明公开了一种基于机器学习算法预测宫颈癌风险的模型,包括:收集样本并处理样本检测的低深度WGS数据,基于机器学习算法构建预测宫颈癌风险的模型;模型构建步骤包括:利用随机森林算法建立CNV模型和临床特征模型,利用Logistics算法将CNV模型和临床特征模型联合,定义为CxC模型,并根据约登指数获取最优的cut off值;利用支持向量机算法建立SNV模型,控制SNV模型的特异性为90%,确定SNV模型对应的cut off值;利用CxC模型和SNV模型获取的两个cut off值分别对样本进行分类预测,将CxC模型和SNV模型联合,定义为CxSEEK模型,在测试集中对CxSEEK模型进行验证;本发明基于低深度WGS技术构建模型,有助于降低测序成本,提升检测的灵敏度和准确性,提高宫颈癌筛查和预测的可及性。
技术关键词
预测宫颈癌
机器学习算法
样本
支持向量机算法
随机森林
训练集
风险
宫颈癌筛查
数据
宫颈刮片
队列
特征选择
定义
体细胞
参数
指数
校正
指标
系统为您推荐了相关专利信息
电子对抗装备
关系抽取方法
朴素贝叶斯分类器
前馈神经网络
多层神经网络模型
钢印字符识别方法
样本
字符识别模型
网络
对比度
游戏直播视频
直方图特征
识别方法
网络流量数据
统计特征