摘要
本发明公开了结合因果推理和共识聚类的CVD死亡亚群识别方法及装置,方法包括以下步骤:收集原始特征数据并进行预处理;对预处理特征数据进行中介因果关系推理,以中介因果关系推理结果中所包含的特征作为初始特征集;利用若干个机器学习模型分别根据输入的特征数据进行死亡风险预测,利用初始特征集训练得到若干个死亡风险预测模型;采用SHAP算法对所有死亡风险预测模型的特征变量计算SHAP值,利用特征变量SHAP值选择最优模型和最优特征集;对最优特征集和最优模型输出的死亡风险预测结果进行共识聚类,得到若干个死亡亚群;对每个死亡亚群的特征数据和生存结果进行统计分析,结合中介因果关系推理结果识别每个死亡亚群的通路。
技术关键词
风险预测模型
识别方法
变量
淋巴细胞
机器学习模型
血红蛋白
指标
聚类
逻辑回归模型
数据收集模块
年龄
近邻算法
特征值
识别装置
识别模块
曲线