摘要
本发明公开了一种基于第三代测序基因组结构变异深度学习检测方法及系统,使用模拟数据和真实数据构建序列数据集;根据各类结构变异的比对模式,对第三代测序技术产生的长读序列的比对数据提取比对、深度信号,实现基因组序列到四通道图像的编码,基于结构变异集及对应的比对数据构建有监督的训练集、验证集、测试集;建立具有注意力机制的双路CNN集成的深度学习分类模型,使用训练集、验证集和测试集进行模型的训练、验证和测试;基于训练好的深度学习分类模型对由序列比对数据编码生成的四通道图像进行预测,根据图像分类的预测结果识别基因组结构变异类型和断点坐标,实现基因组插入、缺失、倒位、重复结构变异的自动检测。
技术关键词
深度学习检测方法
基因组结构变异
深度学习结构
双路卷积神经网络
图像编码
深度学习分类模型
注意力机制
焦点损失函数
染色体
序列
坐标
断点
列表
三通道
训练集
训练图像数据
系统为您推荐了相关专利信息
字形生成方法
序列
神经网络模型
风格
图像编码器
智能马桶清洗
清洗喷头
卷积神经网络模型
图像编码器
智能马桶座圈