摘要
本发明公开了一种基于双分支网络预测转录因子结合位点的方法,包括:将DNA序列转换为K‑mer标记的序列;将K‑mer标记的序列依次输入至基于BERT架构的预训练模型、循环神经网络BiLSTM中、CNN模块中、双分支Dual‑Branch模块中,输出第二全局特征矩阵和第二局部特征矩阵;将第二全局特征矩阵和第二局部特征矩阵分别输入多层感知器中,输出转录因子结合位点的两个概率;将转录因子结合位点的两个概率整合,输出转录因子结合位点的预测结果。本发明可解释性强决策过程透明化、泛化能力强,对TFBS的预测任务准确率高且当数据量较少时,依旧能够保证良好性能,能够在某细胞系中训练之后预测另一细胞系中的转录因子。
技术关键词
转录因子
双分支网络
矩阵
位点
中间层
多层感知器
前馈神经网络
编码器
多头注意力机制
细胞系
标记
DNA序列
模块
线性
批量
指数
系统为您推荐了相关专利信息
无损检测方法
纹理
线性
物体表面粗糙度
待测物体
模型训练方法
多尺度特征
雅可比矩阵
机器可读指令
模块
文档自动生成方法
大语言模型
GCN模型
文本
标准化模板
风险评估方法
双频段
X波段雷达
Kalman滤波算法
随机森林模型