摘要
本申请涉及生物技术领域,提供一种细胞表征模型预训练方法、细胞下游任务处理方法、设备、可读存储介质和程序产品,能够提高细胞表征准确性。细胞表征模型预训练方法包括:确定细胞样本集的多个特征基因,及获取细胞样本集中多个样本细胞各自对应的第一特征基因序列;根据多个特征基因匹配得到多条用于实现不同生物学功能的基因通路;由待训练的细胞表征模型根据各第一特征基因序列和各基因通路,确定各样本细胞对应的细胞编码信息,根据细胞编码信息预测各样本细胞对应的第二特征基因序列;根据样本细胞对应的第二特征基因序列与第一特征基因序列的差异,调整细胞表征模型,直到满足训练结束条件,得到预训练的细胞表征模型。
技术关键词
基因
预训练方法
序列
矩阵
样本
特征提取模块
网络
编码
可读存储介质
计算机程序产品
处理器
注意力机制
信息处理
计算机设备
存储器
元素
生物