摘要
本发明公开了一种基于差异统计的癌症早筛模型的构建方法及系统,属于癌症模型训练技术领域,具体包括:首先提取正常样本与癌症样本的循环游离DNA原始特征,整合后聚类筛选高癌比例簇中的正常样本作为目标组;通过对比目标组与剩余正常组、癌症组与剩余正常组的树模型特征重要性分析,得到第一特征集和第二特征集;获取共同特征集,从所述第二待定特征集中剔除所述共同特征集,得到目标特征集,基于所述目标特征集构建初始分类模型;依次对每个共同特征进行增量训练,得到对应的增量模型和性能评分,并选择性能评分的增量模型作为最终模型,该方法通过聚类引导的对比样本筛选和差异化特征分析,有效提升癌症检测模型的区分能力与泛化性能。
技术关键词
样本
优劣解距离法
执行增量
模型训练技术
数据分析模块
数据获取模块
聚类
构建系统
带标签
总量
序列
断点
数值
节点
参数
系统为您推荐了相关专利信息
分类模型构建方法
多标签
编码机制
启发式规则
语句
非线性特征
主动学习策略
水质检测方法
训练样本集
预测误差
信息检索
合同管理方法
多模态
样本
深度特征提取
动态网络条件
分类模型训练方法
Softmax函数
加密
模型训练模块