摘要
本发明公开了一种基于序列特征与蛋白质语言模型的耐药基因及抗性类别预测方法,包括:1、构建氨基酸数据集和耐药基因数据集;2、计算的互信息、条件互信息、傅里叶功率谱特征、二肽组成、间隔氨基酸对的组成、ESM2矩阵,的互信息、间隔氨基酸对的组成、三元组矩阵,带标签ESM2矩阵,无标签ESM2矩阵;3、构建耐药基因预测网络,得出耐药基因预测分数;4、构建耐药基因抗性类别预测网络,得出耐药基因抗性类别预测分数。本发明能实现对耐药基因及其抗性类别的高效、精准预测,同时在真实基因组数据中的应用验证了其实用性和可靠性。
技术关键词
类别预测方法
XGBoost模型
基因
序列特征
BiLSTM模型
功率谱特征
更新网络参数
矩阵
三元组
特征编码方法
类别预测模型
二肽
传播算法
特征选择算法
带标签
更新模型参数
可读存储介质
系统为您推荐了相关专利信息
数据可视化工具
免疫系统
清除系统
专用接口
解码器模型
视网膜损伤性疾病
年龄相关性黄斑变性
试剂盒
编码
药物组合物
密封电子设备
材质识别方法
识别神经网络
信号
声发射传感器