摘要
本发明涉及一种基于连锁不平衡度的基因分型错误检测和纠正方法,包括:获取全基因组标记基因型数据并转换为ABH格式;将所有标记按物理位置进行染色体划分和排序;对每条染色体上的标记依次进行错误基因型检测;每个标记的检测包括:针对每个个体,寻找与当前标记CM最近的左右侧连无缺失标记LM和RM;若CM的基因型与LM和RM的基因型均相同,则CM的基因型被判定为无错基因型;若CM的基因型与LM或RM的基因型不同,则计算CM的A、H、B基因型的条件概率;将条件概率低于最小概率水平的基因型判定为基因分型错误,并将其校正为条件概率最大的基因型。该方法可准确判定和纠正自然群体和有控制杂交群体中不同类型高通量标记基因分型错误。
技术关键词
纠正方法
错误检测
频率
染色体
平衡度
杂合基因型
统计学方法
标记基因
迭代算法
物理
代表
高通量
校正
格式
数据
序列
图谱
理论