摘要
本申请公开了一种基于蛋白质语言模型的B细胞表位预测方法、装置、设备及计算机程序产品,方法包括:将待预测的蛋白质序列分别输入预训练的ESM‑IF1模型和预训练的ESM2模型,以捕获多维度的结构嵌入向量和序列特征向量后,进行拼接;基于Transformer架构,通过集成卷积神经网络对多维度数据集进行训练,并计算TIM损失函数;利用深度卷积神经网络模型输出蛋白质序列的每个氨基酸位置的预测概率;如果预测概率大于设定阈值,则判定对应的氨基酸位置为表位,否则为非表位。本申请通过有效整合蛋白质语言模型输出的向量,卷积神经网络与Transformer的有机融合,实现对B细胞表位非线性特征的深度挖掘和高效学习,具有预测准确性高、泛化能力强以及鲁棒性良好的优势。
技术关键词
深度卷积神经网络模型
集成卷积神经网络
序列
计算机程序产品
卷积特征
特征提取模块
注意力
非线性特征
数据载体
拼接模块
预测装置
处理器
输出模块
存储器
鲁棒性
标签
坐标
矩阵
系统为您推荐了相关专利信息
点击率预测模型
商品推荐方法
序列
多头注意力机制
兴趣