摘要
本发明属于信息预测技术领域,提供了一种基于多特征融合的氮循环功能基因预测方法及系统,包括:获取含氮代谢基因的蛋白质序列数据;分析蛋白质序列数据,筛选出存在类不平衡的蛋白质序列数据并进行基于伪突变策略的蛋白质序列数据增强,数据增强后的少数类别蛋白质序列和不存在类不平衡的蛋白质序列构成平衡蛋白质序列数据集;基于双向长短期记忆网络处理不同长度的平衡蛋白质序列数据集,提取氨基酸残基的上下文特征,通过自注意力机制构建任意两个氨基酸残基之间的关系以提取蛋白质序列中氨基酸残基的全局特征,通过深度神经网络融合上下文特征和全局特征,基于融合特征计算基因家族的预测概率,预测氮循环功能基因。
技术关键词
基因预测方法
双向长短期记忆网络
深度神经网络融合
序列
上下文特征
注意力机制
数据
融合特征
无监督神经网络
信息预测技术
全局平均池化
家族
计算机程序产品
处理器
预测系统
输出特征
策略
可读存储介质
系统为您推荐了相关专利信息
头部运动轨迹
唤醒方法
音频特征
头部特征
头部动作操控
网络协调器
数据变化趋势
集成传感器
数据采集策略
工厂环境监测系统
地面机器人
远程协同控制方法
机器人控制指令
大数据
生成机器人
航迹数据
智能化无人机
序列
飞行控制方法
计算中心
风力发电机
温度监测方法
节点
多传感器
时序特征