摘要
本发明公开了生物信息学技术领域内的一种基于可解释性机器学习的抗生素抗性基因的宿主分析方法,包括以下步骤:步骤1)基因组数据收集:收集同种环境样品的大量基因组数据,计算基因数据中抗生素抗性基因、物种菌属的种类和相对丰度并将其处理成矩阵,使用Pauta准则对选定抗生素抗性基因的相对丰度进行分析、去除异常值后划分训练集和测试集;步骤2)分析模型的构建;步骤3)可解释的相关性分析:通过Shap值量化模型中不同菌属对抗生素抗性基因的贡献,根据不同菌属平均Shap值的差异判断菌属对于抗生素抗性基因的影响,本发明可以分析多种细菌菌属与抗生素抗性基因的相关性,为抗生素抗性基因的生态风险评价和管理提供必要的技术支持。
技术关键词
抗性基因
抗生素
分析方法
CatBoost算法
模型预测值
相关性分析模型
生物信息学技术
生态风险评价
最佳参数组合
误差
数据
超参数
回归算法
特征值
湖泊水
矩阵
河流水
污废水
网格
随机森林
系统为您推荐了相关专利信息
支持向量机模型
数据实时监控
商品条码
气象
编码
电力系统负荷特性
聚类算法
分析方法
数据处理模块
数据获取模块
设备故障诊断方法
评估设备
设备故障诊断系统
人工智能算法模型
时序特征
统计方法
需求预测模型
电池健康状态
时间段
车载传感器
总初级生产力
多层次
反演方法
光谱反射率曲线
叶片结构