摘要
本发明涉及一种基于蛋白质语言模型与多尺度卷积神经网络的Cas蛋白识别方法及系统。所述方法包括:获取收集到的不同的Cas蛋白数据集,数据集中包含有蛋白质序列;通过AATP特征通道对输入的蛋白质序列进行编码,将蛋白质序列表征为AATP特征;通过ESM‑2特征通道对输入的蛋白质序列进行编码,提取出蛋白质序列中的蛋白质嵌入特征;将压缩后的AATP特征、ESM‑2特征进行融合,得到融合特征;基于融合特征对Cas蛋白识别模型训练。通过使用双特征通道分别对输入的蛋白质序列进行编码,提取出两个特征之后再进行压缩降维融合处理,使得训练出的Cas蛋白识别模型能够简单快捷的筛选出可能的Cas蛋白,高效且成本低。
技术关键词
嵌入特征
多尺度卷积神经网络
蛋白
融合特征
识别模型训练
序列
识别方法
通道
编码
交叉验证方法
数据收集模块
矩阵
模型训练模块
特征提取模块
识别系统
聚类
超参数
策略
系统为您推荐了相关专利信息
宏观交通流
微观交通流
交通流预测方法
交通图
卷积神经网络模型
激光雷达点云数据
相机图像数据
装卸设备
协同定位方法
多传感器融合