摘要
本发明涉及生物信息和计算免疫技术领域,且公开了基于蛋白质语言模型和双重多实例注意力机制的肽‑HLA I类等位基因亲和力预测系统,所述预测系统包括:肽与人类白细胞抗原HLA I类分子的序列编码与分布式表示模块、动态选择机制长短期记忆网络LSTM进行多层次特征提取模块、双重多实例注意力模块和特征融合及亲和力预测模块。本发明通过对于包含HLA I类分子与多肽的分子序列,利用自训练的表位肽蛋白质语言模型和HLA I类分子蛋白质语言模型来获取氨基酸序列的特征编码向量,来更好的表征分子序列;对氨基酸之间可变长度的依赖问题,利用改进的动态选择机制LSTM学习序列中不同距离氨基酸之间的依赖特征,达到了改善HLA抗原呈递的预测效果的有益效果。
技术关键词
多实例
亲和力
HLAI类分子
预测系统
注意力机制
多层次特征提取
表位肽
模块
动态
表达式
人类白细胞抗原
序列特征
长短期记忆网络
LSTM模型
编码
非线性
系统为您推荐了相关专利信息
磁异常检测方法
海洋噪声
重构模型
注意力机制
重构误差
细观结构重构方法
图像深度学习
重构模型
多尺度
注意力机制
相似性检测方法
程序
数据依赖关系
多头注意力机制
生成指令
人工蜂群算法
工作流
任务调度方法
邻域
注意力机制