摘要
本发明公开了一种DNA序列上的表观遗传修饰信号预测方法,涉及生物信息处理领域。该方法步骤包括:数据准备:对WGBS和CAPS数据分别计算CpG位点上下游的5‑甲基胞嘧啶(5mC)修饰水平和5‑羟甲基胞嘧啶(5hmC)修饰水平,作为模型的目标数据,并根据染色体编号进行分类,分别构建训练集和测试集;特征表示:合并训练集和测试集中的上下游50bp的DNA序列和上下游50个CpG位点的甲基化水平数据特征进行表示,以构建训练所需的特征输入矩阵;模型训练和调优:使用卷积神经网络模型和均方误差损失函数进行训练和参数调优,用于实现对5hmC的修饰水平的预测。本方法仅需WGBS测定的DNA甲基化信号,降低了对生物检测数据的依赖性,使预测模型更具可操作性;提高了预测精度和效率。
技术关键词
信号预测方法
表观遗传修饰
DNA序列
卷积神经网络模型
染色体
位点
数据
胞嘧啶
矩阵
学习特征
信息处理
样本
计算方法
训练集
参数
甲基
误差
生物
编码
系统为您推荐了相关专利信息
酒驾预警方法
神经网络预测模型
生理特征数据
车载摄像头
酒驾预警系统
特高压直流换流阀
高压直流输电系统
故障工况
特征量波形
短路故障定位系统