摘要
本发明适用于生物信息学技术领域,提供了基于微生物毒力因子功能基因集的机器学习分类方法。该方法从宏基因组和宏转录组数据中提取毒力因子相关信息,经质量控制、匹配定量后,结合VFDB数据库中14个毒力因子功能类,通过单样本基因集富集分析计算每个样本在各功能类上的得分,形成特征样本矩阵,再利用XGBoost模型进行分类。该方法考虑到毒力因子的重要作用,通过功能类打分方法减少特征数量,提高分类稳健性和推广性,支持单个样本分析。模型验证结果显示,其在训练集和测试集上均表现出较优的分类效能,AUC大于0.90,灵敏度、特异度、准确度、精准度和召回率均≥80%,为基于微生物特征的类别区分提供了有效手段。
技术关键词
微生物毒力因子
机器学习分类方法
基因
累积分布函数
XGBoost模型
富集分析方法
样本
生物信息学技术
分类效能
打分方法
超参数
机器学习模型
序列
数据
特异
矩阵
指标
系统为您推荐了相关专利信息
基因组测序数据
分析方法
动态数据库
医学知识图谱
序列
STR基因座
SNP基因座
分析试剂盒
位点
芯片载体表面
风险评估方法
淋巴
深度学习模型
肿瘤免疫治疗技术
样本
风险评分模型
非瞬时性计算机可读存储介质
靶向测序技术
患者
预测效能