摘要
本发明涉及生物信息学与植物基因组学的交叉技术领域,公开一种水稻根单细胞类型注释模型的构建方法及其系统,采用双重标准化策略,对来自不同数据源的水稻根单细胞测序数据进行数据整合,能够消除多源数据整合中的批次效应,优化植物特异性高噪声特征,精准划分水稻根单细胞类型动态连续谱系;利用梯度提升决策树通过有序提升策略和分类特征处理机制,训练模型学习不同类型水稻根单细胞的水稻根单细胞测序数据,有效克服类别不平衡与高维稀疏性问题,得到高精度的水稻根单细胞类型注释模型,能够精准地识别待测水稻根单细胞属于某细胞类型的概率并进行细胞类型注释,提高水稻根单细胞类型注释的效率、准确性和自动化程度,促进植物细胞的研究。
技术关键词
梯度提升决策树
注释方法
非暂态计算机可读存储介质
过采样技术
注释系统
工具包
模型超参数
效应
机器学习算法
消除技术
噪声特征
数据获取模块
策略更新
分类特征
处理器
生成特征
基因
存储器
系统为您推荐了相关专利信息
卡顿检测方法
数据流特征
核心
模式
卡顿检测装置
识别神经网络
肿瘤
识别方法
淋巴细胞
语义分割网络
异常检测方法
铁路货车故障识别
重构
非暂态计算机可读存储介质
图像