摘要
本申请涉及一种基于集成机器学习模型的妊娠糖尿病风险预测方法和装置。所述方法包括:基于地理区域分布以及易获得的数据构建样本集,使用相关性算法对样本数据之间进行相关性分析,以此对样本数据进行筛选,采用Garson算法计算集成机器学习模型中单个模型对于筛选后的样本数据的重要性权重,对每个模型的重要性权重进行加权,得到样本数据的整体重要性,根据整体重要性,确定样本数据的特征子集,并且采用交叉验证,确定最佳特征子集,采用综合医院样本和专业医院样本对应的最佳特征子集训练集成机器学习模型。根据集成机器学习模型的预测风险,进一步开发直观的决策树风险预测工具。采用本方法能够减小妊娠糖尿病预测成本以及提高适用范围。
技术关键词
集成机器学习
样本
最佳特征子集
妊娠糖尿病
医院
数据
风险预测方法
梯度提升机
天门冬氨酸氨基转移酶
算法
随机森林
专业
丙氨酸氨基转移酶
多囊卵巢综合征
谷氨酰转移酶
变量
风险预测装置
妊娠期糖尿病
网络
碱性磷酸酶