摘要
本发明公开了一种基于轻量化卷积与双注意力机制的启动子DNA序列表达水平预测方法,属于人工智能结合生物信息领域。首先对启动子DNA序列进行统一长度处理和四通道One‑hot编码,得到特征矩阵。接着利用KMeans聚类算法和斯皮尔曼相关系数分析,确定碱基含量及2‑mer、3‑mer序列与基因表达水平的相关性。基于此构建轻量化卷积神经网络模型,该模型采用双链分离处理模块和阶梯递减卷积核架构,融合通道注意力机制与局部窗口注意力机制,以增强关键特征响应和捕捉局部序列特征权重。通过大量样本数据训练模型,优化参数并评估泛化能力,最终得到可用于预测启动子DNA序列表达水平的模型,该模型在保持高预测精度的同时降低了参数量,提高了训练效率,可应用预测蛋白质表达。
技术关键词
水平预测方法
DNA序列
轻量化卷积神经网络
启动子
通道注意力机制
斯皮尔曼相关系数
Sigmoid函数
序列特征
蛋白质表达
阶梯式
编码
基因
调控元件
生成特征
矩阵
系统为您推荐了相关专利信息
OD客流数据
站点
客流预测
卷积神经网络模块
通道注意力机制
空间模块
语义分割方法
船舶
输出特征
离散状态空间
区域分割方法
形态学特征
噪声预测
纹理特征
多尺度