摘要
本发明公开了一种基于队列基因型数据驱动的突变致病性分类模型的构建方法及系统,该方法将待研究疾病的已知致病性分类的SNV突变作为目标突变,使用目标突变在基因组上的发生位置信息,从群体队列的基因型数据集中提取目标突变所处的环境变异信息,并基于已有突变有害性预测工具识别所提取的每个目标突变的环境变异的有害性信息,结合目标突变的致病性标签,机器学习模型的训练和测试评估,得到对应待研究疾病的突变致病性分类模型。本发明的方法利用人群队列基因型信息反映SNV真实的变异环境,利用已有的突变有害性预测对队列基因型突变进行评估并提取特征,使得模型应用更加全面的特征类型,有利于提高致病性分类模型识别准确性,促进临床应用。
技术关键词
队列
数据
机器学习模型
交叉测试方法
分类模型识别
测试特征
训练特征
分类系统
疾病
标签
频率
参数
基因
矩阵
元素
系统为您推荐了相关专利信息
环境感知数据
交互方法
可穿戴设备
构建用户画像
语音
分布式存储系统
集群
负载均衡方法
资源
计算机设备
模型构建方法
气象
GNSS高精度定位
资料
机器学习模型