摘要
本发明公开了一种面向单细胞染色质开放性数据的细胞类型自动注释方法,包括:步骤1、基于TF‑IDF的数据预处理;步骤2、训练集的类型均衡处理;步骤3、使用步骤2得到的处理后的训练集通过对比学习对MLP进行训练,得到训练后的MLP;步骤4、利用低维表示的多层级注释:利用训练后的MLP分别得到细胞的低维表示,再根据各自的细胞的低维表示,分别得到第一软标签注释矩阵、第二软标签注释矩阵和细胞类型识别结果;再根据第二软标签注释矩阵计算出细胞类型特异性染色质可及峰,同时将第一软标签注释矩阵、第二软标签注释矩阵和细胞类型识别结果进行整合,得到最终的注释结果。本发明注释性能精确,能够注释稀有细胞类型和识别未知细胞类型。
技术关键词
矩阵
注释方法
样本
平衡技术
Sigmoid函数
训练集
数据标签
过采样技术
半监督学习
掩码策略
定义特征
生成向量
K近邻
层级
噪声
元素
系统为您推荐了相关专利信息
三维重建方法
图片
特征点
组合算法
三维点云数据
卷积循环网络
信道均衡系统
卷积循环神经网络
样本
判别模块
信息展示模块
特征提取模块
档案管理系统
参数
矩阵
历史负荷数据
样本
多头注意力机制
模型训练方法
K折交叉验证法