摘要
本发明公开了一种识别DNA序列中超级增强子与典型增强子的预测方法,采用整数编码和k‑mer编码方案进行编码,使用残差连接的卷积神经网络提取序列的局部特征,使用两个双向长短期记忆网络提取序列的多尺度全局特征。利用注意力机制将这些局部特征和全局特征进行特征融合,然后输入到全连接神经网络中得到预测概率。采用五折交叉验证的评估方式对模型性能进行评估,使用准确率(ACC)、召回率(REC)、精度(PRE)、F1分数(F1)、ROC曲线下面积(AUC)等五个评估指标衡量模型;独立测试集上的实验结果表明,相比于最先进的方法,我们的模型在识别超级增强子与典型增强子上有了显著的性能提升。
技术关键词
增强子
双向长短期记忆网络
卷积神经网络提取
DNA序列
编码方案
注意力机制
典型
小鼠
数据
曲线
人类
指标
高性能
精度
批量
样本
系统为您推荐了相关专利信息
显示屏画面
缺陷检测方法
图像采集装置
OLED显示屏
亮度
语义实体
继电保护定值单
电力系统继电保护
信息抽取方法
分区
入侵监测系统
智能算法
气象传感器
分布直方图
可见光摄像机