摘要
本发明涉及生物信息学技术领域,尤其涉及一种癌症甲基化数据中异常高甲基化区域的识别方法。该方法包括以下步骤:获取待测样本的全基因组甲基化测序数据以及灵长类物种的基因组保守序列数据;根据全基因组甲基化测序数据对CpG位点进行基于递进式分层扫描策略的密度分析,得到CpG富集区域数据;对基因组保守序列数据进行包括短程、中程和长程三个尺度的距离计算,并根据CpG富集区域数据对计算结果进行加权校正,得到区域保守性得分数据。本发明通过无监督聚类、自适应阈值设定和多尺度特征提取,能够更精准地捕捉不同癌症类型中具有高度调控作用的高甲基化区域。
技术关键词
数据
识别方法
位点
富集
扫描策略
区域分布特征
统计特征
分区
空间分布特征
多序列比对算法
分层
组织
核密度估计方法
生物信息学技术
初始窗口大小
校正
重复序列
滑动窗口
系统为您推荐了相关专利信息
离子检测
水质检测方法
误差补偿模型
检测仪器
传感器
个性化营销方法
电子产品
分布式数据流
马斯洛需求层次理论
多维度评估模型
量子通信网络
智能密钥
双向长短期记忆网络
噪声统计
信道特征
视觉特征
理解系统
交叉注意力机制
大语言模型
变换器