摘要
本申请涉及一种蛋白质序列性质预测方法、装置、设备和存储介质,其中,所述方法包括:基于ESM蛋白质语言模型和多任务分类器,构建多任务分类模型;将蛋白质序列数据集输入至多任务分类模型中进行训练,蛋白质序列数据集包括多个指定蛋白质序列以及对应的标签,所述ESM蛋白质语言模型用于对各所述指定蛋白质序列进行特征提取,得到第一特征向量矩阵;所述多任务分类器用于基于所述第一特征向量矩阵以及对应的标签对所述多任务分类模型进行训练,得到蛋白质性质预测模型;将目标蛋白质序列输入至所述蛋白质性质预测模型中进行预测,得到所述目标蛋白质的酶类别、底物类型、核酸结合特性,提高了预测效率和准确性。
技术关键词
多任务分类
分类器
误差矩阵
性质预测方法
序列
标签
底物
核酸
模型训练模块
数据
注意力机制
预测装置
处理器
计算机设备
可读存储介质
存储器