摘要
本发明公开了一种能改进基于CCS的单分子5mC甲基化检测准确度的方法,该方法包括获取原生数据集及经过处理的数据集,构建训练数据集及测试数据集;构建基于图卷积深度神经网络的单分子CpG甲基化识别模块,并利用不同背景碱基长度的训练数据进行训练;进行背景碱基长度和模型性能的测试,选定合适的碱基长度并训练对应模型;利用训练好的基于图卷积深度神经网络的单分子CpG甲基化识别模块进行单分子5mC甲基化检测。本发明的读段计数模式的全基因组甲基化频率定量结果在包括不同数据来源、测序文库长度或测序深度的所有测试数据集中,均表现优越。此外,本申请高的CpG甲基化识别能够发现复杂的单分子CpG甲基化模式,包括单倍型和重复区域的甲基化模式。
技术关键词
卷积深度神经网络
CpG甲基化
识别模块
分子
位点
数据获取模块
斑马鱼
样本
频率
人类
预训练模型
模式
线性单元
脉冲
硫酸氢盐
载体
芯片
节点
系统为您推荐了相关专利信息
检测预警方法
情绪特征
号码
关键词
语音识别技术
耐甲氧西林金黄色葡萄球菌
肾脏
肝脏
小鼠模型
因子
信号处理模块
综合显示器
诊断方法
子模块
自检模块
匹配定位方法
多特征参数
地磁
运动特征
周期性特征