摘要
本发明提供了一种基于机器学习的糖尿病预测方法及系统,包括:收集患有糖尿病和未患糖尿病研究对象相关性信息,得到原始数据集;删除原始数据集中含有缺失值信息样本,并按照比例划分为训练集和测试集;在训练集上标准化数据,将标准化参数应用于测试集;使用Boruta算法在训练集筛选出重要糖尿病预测特征,并根据筛出的重要特征生成最终的测试数据集;在最终的测试数据集上使用多种机器学习算法进行建模;采用机器学习评价指标来评价预测模型性能,找出性能表现最好的模型用于糖尿病预测。本发明的Boruta特征筛选法能考虑特征间的相互作用,不会遗漏重要特征,同时具有鲁棒性与稳定性,不会陷入局部最优解,无需人工干预大大提高了效率。
技术关键词
糖尿病预测方法
训练集筛选
体检数据信息
评价预测模型
机器学习算法
预测系统
患有糖尿病
预测特征
指标
标准化方法
多层感知器
血红蛋白
随机森林
尿素氮
对象
生理
模块
疾病
参数
系统为您推荐了相关专利信息
属性预测模型
遥感反演方法
序列遥感影像
机器学习算法
亮度
网络设备数量
机器学习算法
网络安全保障
数据清洗技术
访问控制机制
继电保护装置
环境测试方法
实验室信息管理系统
测试环境数据
继保装置
协同分析方法
节点
网络状态信息
直流潮流模型
历史负荷数据
气流加热器
逆流换热器
近红外光谱分析装置
风冷隧道
回收模块