摘要
本发明涉及一种基于特征融合及交叉注意力机制的抗癌肽预测方法及系统。所述方法包括:构建包含有各个蛋白质序列的数据集;将蛋白质序列输入至蛋白质语言模型ESM‑2中提取肽类结构特征;将蛋白质序列输入至特征提取模型中提取肽类物理化学特征;对肽类结构特征进行维度变换处理,使用BiLSTM将离散的肽类物理化学特征连续化;使用交叉注意力机制进行特征融合,得到目标特征输入至多层感知机MLP中,得到抗癌肽预测结果。通过使用蛋白质语言模型提取肽类结构特征,使用传统的特征提取模型提取肽类物理化学特征,使用交叉注意力机制进行特征融合,无需耗时提供高成本,且提取出来的特征相互关联,可以快速、高效、准确进行抗癌肽预测。
技术关键词
物理化学特征
交叉注意力机制
特征提取模型
序列
多层感知机
肽类
数据收集模块
双向长短期记忆网络
编码器
加权特征
结构特征提取
预测系统
前馈神经网络
矩阵
特征提取模块
线性
冗余
系统为您推荐了相关专利信息
点云特征提取
交叉注意力机制
解码器
训练集
激光雷达
中央空调柔性控制方法
连续模拟量
后系统
稳定系统
非线性特征提取