摘要
染色质相互作用是指染色质区域间通过物理接触或空间接近形成的关键调控关系,对基因组的结构、功能及疾病的发生发展具有重要意义。本文提出了一种基于基因序列和基因组特征相结合的深度学习模型,称为TECM‑ChI。首先在模型中设计了FCR(Forward Combine Reverse)方法将K562、IMR90和GM12878三个数据集中的正负样本进行平衡并达到1:1的比例。同时,为了充分提取基因序列中的有效信息,开发了预处理Three‑Encoding模块,使用三种编码方法(KNF+NAD+NCS)将每个核苷酸拼接为45维向量。其次,我们提出了CMANet网络模型,将多层卷积与多个注意力相结合,CMANet能很好的提取序列信息中的局部特征以及增加对关键区域的关注,以提升对染色质相互作用的识别能力。实验证明了TECM‑ChI在预测染色质相互作用方面的有效性和泛化能力。
技术关键词
染色质相互作用
核苷酸
样本
细胞系
深度学习模型
DNA序列
编码方法
基因
数据
板块
网络
注意力
矩阵
有效性
参数
标签
代表
疾病
系统为您推荐了相关专利信息
历史故障信息
系统故障检测
异常信息
储能系统
神经网络模型
命名实体识别
网络安全知识图谱
网络安全数据
多头注意力机制
BERT模型
视频生成模型
视频生成方法
风格
音频编码器
面部
外观检测系统
图像采集模块
图像传输模块
特征提取模块
识别模块