摘要
本发明适用于生物信息学领域,具体是一种基于深度学习和长读测序的SNP和INDEL检测方法,包括:对待检测数据进行第一预处理,生成第一叠加图像,将第一叠加图像作为SNP检测模型的输入,输出得到SNP的VCF文件;对待检测数据进行第二预处理,生成第二叠加图像,将第二叠加图像作为INDEL检测模型的输入,输出得到INDEL的VCF文件;利用基于R语言的VcfR数据处理工具,对所得到的VCF文件中的数据进行变异检测和处理,得到基因组上的变异检测结果;使用IGV输出显示基因组上的变异检测结果。本发明使用了深度学习技术和长读测序技术,能够解决传统方法在灵活性与泛化能力、计算效率上的低性能,以及面对复杂问题时短读测序存在的无法检测区域的问题。
技术关键词
位点
核苷酸
图像
数据处理工具
矩阵
全局比对算法
卷积特征
站点
频率
深度学习技术
测序技术
通道
重复序列
符号
条目
网络
浮点数
分阶段
系统为您推荐了相关专利信息
文本特征向量
点云编码
文本编码器
对齐模块
查询特征
挤压检测设备
图像处理系统
多角度
多工位
送料机构
分析图像数据
样本
分辨率
生成图形用户界面
显示器
三维重建方法
三维重建装置
图像数据采集设备
立方体
三维模型