摘要
本发明公开了一种基因‑表型关联分析模型及其建立方法和应用,属于生物医药技术领域。该模型建立方法包括:S1:收集已知关联的性状‑基因数据,构成基因‑性状对;S2:应用公式计算各基因罕见突变类型评分;S3:通过线性回归分析突变评分与性状的相关性,计算各突变类型权重,并优化权重组合,以相关性R2作为评估标准;S4:根据评分公式和优化权重,计算样本基因的罕见突变负荷分数;S5:通过回归方法,分析突变负荷分数与表型的关联性,构建基因‑表型关联分析模型。与传统gene‑base collapsing方法相比,本模型具有较好重现性和互补性,可用于发现新性状或未知疾病的候选风险基因。
技术关键词
逻辑回归方法
低密度脂蛋白胆固醇
疾病相关基因
线性回归方法
负荷
等位基因突变频率
原发性开角型青光眼
随机森林模型
非高密度脂蛋白
高密度脂蛋白胆固醇
超参数优化方法
年龄相关性黄斑变性
数据分析模块
数据存储模块
关联分析系统
上皮性卵巢癌
脂肪酸
双相情感障碍