摘要
本发明提供了一种基于机器学习的真菌表型条形码筛选方法,该方法包括:根据已发表标本和新鲜标本获取真菌数据;将真菌数据中的表型特征进行拆分转换,得到单位特征;对单位特征进行数据预处理,得到预处理数据,并将预处理数据划分为测试集和训练集;通过测试集和监督学习算法选取分类器的最佳参数,并根据最佳参数筛选出最佳模型;基于最佳模型,对单位特征进行重要性分析得到重要性排序;根据重要性排序筛选出条形码特征。该方法通过基尼系数、排列重要性和加性解释值来分析每个类别对应的特征的重要性,提高了识别筛选的多样性和精准度。
技术关键词
监督学习算法
筛选方法
真菌
条形码特征
表型特征
分析单元
连续型
数据
分类器
支持向量机算法
逻辑回归算法
参数
神经网络算法
决策树算法
DNA序列
筛选系统
模块
训练集
系统为您推荐了相关专利信息
信号识别方法
双门限信号检测
谱估计
功率谱密度估计
判别方法
突变型结直肠癌
筛选方法
分型检测试剂盒
机器学习算法
石蜡包埋组织
神经纤维模型
筛选方法
医学影像数据
三维模型
患者
药物筛选方法
亲和力预测模型
配体
药物虚拟筛选方法
节点