摘要
本发明公开了基于单分子长读长序列图混合模型的体细胞结构变异检测方法,该方法通过提取目标结构变异区间及其侧翼区域的读长局部序列,利用偏序比对图算法构建局部图基因组,并对多重序列比对结果进行编码。然后,使用多类别混合模型结合期望最大化算法,对比对数据进行聚类分析,从而识别出仅来源于肿瘤样本的体细胞结构变异类别。最终,生成肿瘤样本中的体细胞结构变异区域共识序列,作为局部基因组的最优化结果。相比现有的短读长测序方法,本发明能够有效解决比对误差、低复杂度序列和基因组异质性问题,显著提高体细胞结构变异的检测精度。通过单分子长读长测序技术的应用,本发明能够提供更全面、精准的基因组信息。
技术关键词
变异检测方法
体细胞
期望最大化算法
肿瘤
分子
样本
贝叶斯信息准则
长读长测序
编码
聚类
测序方法
变量
序列特征
识别模块
关系
复杂度
侧翼
系统为您推荐了相关专利信息
预后预测系统
高维特征向量
特征提取模块
数据输入模块
肿瘤
大环内酯类抗生素
抗肿瘤化合物
大环内酯抗生素
药物溶液
亲和力
种质资源评价
智能培育箱
选育方法
物联网传感器监测
AI算法
数字孪生体
CT图像数据
三维模型
滤波反投影算法
深度学习模型训练