摘要
本发明公开了一种基于蛋白质语言模型与多模态神经网络的通用HLA抗原呈递预测方法,首先,从免疫表位数据库提取已验证的HLA结合肽段序列,结合蛋白质数据库生成等量的非表位肽段序列,构建HLA‑I类与HLA‑II类的平衡数据集。随后,利用蛋白质语言模型提取肽段序列的序列嵌入特征与接触图结构信息;通过图神经网络处理接触图构建的蛋白质图以获得全局结构特征,同时采用一维卷积神经网络(1DCNN)对序列嵌入进行区域卷积与残差卷积处理,提取局部上下文序列特征。本发明有效融合了序列语义与空间结构信息,提升了HLA抗原呈递预测的准确性与泛化能力,适用于多种HLA亚型下的免疫识别建模任务。
技术关键词
节点特征
结构编码器
嵌入特征
卷积特征
一维卷积神经网络
矩阵
样本
全局平均池化
下一代测序数据
空间结构信息
模块
多模态特征
线性单元
序列特征
传播算法
蛋白
系统为您推荐了相关专利信息
岩土工程勘察
空间邻近关系
数据分析方法
数据分析系统
岩土参数
融合结构特征
药物靶点预测方法
系统特征
特征提取模块
靶点结构
柔性机器人控制
多模态特征
融合特征
手势特征
表情特征
火灾风险评估
卷积特征
动态更新
正则化参数
线性回归模型
抑制剂筛选方法
卷积网络模型
靶标相互作用
基因
毒性测试