摘要
本发明公开了一种噬菌体特异性的抗细菌肽数据处理应用方法,其中方法包括:从公开数据库中,收集噬菌体多肽数据、收集抗细菌肽数据和非抗细菌肽数据;对抗细菌肽数据和非抗细菌肽数据进行冗余序列去除后,分别与噬菌体多肽数据进行同源性分析,并进行预处理后,获取噬菌体特异性的抗细菌肽数据和非抗细菌肽数据;构建正样本数据集和负样本数据集;数据应用包括:训练神经网络,进行神经网络应用,获取噬菌体特异性抗细菌肽或非抗细菌肽数据正负样本分类预测。本发明方法有效的对噬菌体和抗细菌肽之间的协同作用进行探索,实现噬菌体特异性抗细菌肽/非噬菌体特异性抗细菌肽准确的目标分类,为后续噬菌体的工程改良及潜在高效抗细菌肽的发掘做出贡献。
技术关键词
噬菌体
数据
多肽
开放阅读框
训练神经网络
样本
嵌入特征
非天然氨基酸
冗余
预训练模型
重复序列
训练集
编码
字母
策略
系统为您推荐了相关专利信息
光电转换器
运动伪影
信号
运动姿态数据
轴向位移量
动态数学模型
窑炉
线性二次型调节器
热工参数
玻璃
辅助生殖技术
时间序列预测模型
长短期记忆网络
互联网医院平台
患者