摘要
本发明公开一种基于表观遗传组学的插入缺失调控预测方法、设备及介质,该方法包括获取组织特异性的非编码插入缺失突变数据和组织特异性的表观遗传组学数据,计算对应组织之间的插入缺失突变位点与表观遗传修饰位点的富集情况,构建平衡的正负样本集合;利用中位数填补法填充基因组功能注释中的缺失值,并将填补后的基因组功能注释与序列类别特征拼接,作为模型的输入特征;利用贝叶斯优化寻找模型最佳参数,进行模型训练及预测;本发明利用组织特异性表观遗传组学数据划分正负样本,并结合全面基因组功能注释和序列类别特征,以构建性能优异的组织特异插入缺失调控性预测模型,更高效地筛选出具有潜在调控功能的插入缺失突变。
技术关键词
机器学习分类器
组织
表观遗传修饰
样本
位点
富集
数据
参数优化模型
序列
处理器
编码
特异
调控功能
支持向量机
训练集
矩阵
随机森林
计算机设备
系统为您推荐了相关专利信息
自动检测方法
时序特征
推理网络
尿样收集装置
样本
振动筛筛分效率
加速度
矩阵
拉格朗日乘子法
遗传算法
土壤呼吸速率
神经网络模型
遥感影像数据
缓冲
因子