摘要
本发明提供的基于蝴蝶优化与CatBoost肝脏疾病预测模型的构建方法及装置,涉及疾病数据分析处理技术领域。本发明通过获取不平衡的肝脏疾病数据集;采用十折交叉验证法,将预处理后的原始数据集划分训练集和测试集;然后将训练集输入CatBoost模型进行训练,并采用蝴蝶优化算法对CatBoost模型的二元分类阈值和超参数进行优化,当设定的目标函数达到最大化时,得到最优模型参数;将测试集输入设有最优模型参数的CatBoost模型进行测试评估,得到构建好的基于蝴蝶优化与CatBoost肝脏疾病预测模型;将新获取到的肝脏疾病数据集输入构建好的预测模型进行预测,得到肝脏疾病预测结果。本发明能解决CatBoost模型对超参数的选择敏感的问题,达到最优的分类结果,从而提升模型预测准确性。
技术关键词
肝脏
分类阈值
疾病
交叉验证法
参数
表达式
分类器
训练集
样本
数据
指标
算法
条目
列表
代表
误差