摘要
本申请公开了一种基于遗传和非遗传特征预测静脉血栓栓塞症的方法、设备、介质及产品,涉及医疗数据处理领域。该方法包括采用LASSO回归算法对筛选的遗传生物因素指标和非遗传因素指标进行特征筛选;将发生和未发生静脉血栓栓塞症的患者对应的、筛选得到的遗传和非遗传特征作为阳性集和阴性集,并利用分层抽样法随机分成训练集和测试集;采用训练集和测试集对多种机器学习模型进行训练和测试,直至多种机器学习模型均达到设定条件时,集成多种训练好的机器学习模型得到静脉血栓栓塞症预测模型;将检测者的遗传和非遗传特征输入至静脉血栓栓塞症预测模型,得到静脉血栓栓塞症预测结果。本申请能够显著提高静脉血栓栓塞症预测的实时性和精确性。
技术关键词
静脉血栓栓塞
机器学习模型
多态性位点
回归算法
指标
高密度脂蛋白胆固醇
低密度脂蛋白胆固醇
核苷酸
线性回归模型
随机森林模型
生物
处理器
评分方法
关键词
计算机程序产品
甘油三酯
患者
计算机设备
可读存储介质