摘要
本申请涉及一种基于LSTM模型的抗菌肽序列的抗菌活性预测方法及系统,方法包括:构建训练样本训练集,样本训练集包括正样本集和负样本集,正样本集包括经过预处理的目标菌属的抗菌肽序列,负样本集包括经过预处理的非抗菌肽序列;利用预训练的蛋白质语言模型提取样本训练集的第一高维嵌入特征;以样本训练集的抗菌活性作为标签,利用第一高维嵌入特征对初始的LSTM模型进行训练,得到训练好的LSTM模型;利用蛋白质语言模型提取待预测的抗菌肽序列的第二高维嵌入特征,将第二高维嵌入特征输入至训练好的LSTM模型,输出待预测的抗菌肽序列的抗菌活性。本申请显著提升抗菌活性预测的准确性。
技术关键词
嵌入特征
抗菌肽
抗菌活性预测
样本
LSTM模型
训练集
标签
模型训练模块
特征提取模块
数据处理模块
序列特征
计算误差
传播算法
处理器
计算机设备
优化器
可读存储介质
存储器
系统为您推荐了相关专利信息
时序特征
全局特征提取
拓扑结构特征
灰色预测模型
分层迁移学习方法
通道注意力机制
图像
池化特征
计算机可执行指令
蒸馏
数据可视化显示
农田驱鸟
热释电红外传感器
数据处理工具
数据采集模块
面部表情识别方法
识别标签
样本
正则化模型
分类网络