摘要
本发明公开了一种慢性疾病风险预测模型训练方法及系统,方法包括:从多个异构数据源中收集与慢性疾病相关的患者数据,以生成多种模态的初步数据特征集;基于集成学习算法,对初步数据特征集实施多层次特征选择,筛选对慢性疾病风险的影响程度达到预设标准的关键特征;利用注意力机制对各个关键特征加权,生成加权特征;基于加权特征生成不同层次的特征子集,利用各特征子集对待训练模型进行分层训练,以使模型逐步学习不同特征对慢性疾病风险预测的影响,得到训练完成的慢性疾病风险预测模型。利用本发明实施例,能够整合多模态数据,实施有效的特征选择与加权,以实现模型的分层训练,从而提高慢性疾病风险预测模型的准确性和实用性。
技术关键词
疾病风险预测模型
加权特征
集成学习算法
注意力机制
电子健康记录
特征选择
遗传算法优化
数据
梯度提升树
异构
消除技术
多层次
随机森林
高层次
分层
患者
训练系统