摘要
本发明公开了一种含缺失的多源多标签医学临床数据特征选择方法,包括:1 输入多源的医学临床文本数据;2对文本数据进行缺失数据补全;3 对补全后的文本数据进行过采样获得类平衡的数据;4 采用改进的无限特征选择算法对每个数据源进行源内临床特征选择;5 对不同数据源得到的临床候选特征集进行源间冗余消除,得到消除冗余特征的临床特征选择集。本发明能从大量的包含缺失的医学临床数据中筛选出重要性高的临床特征,从而能提高异常发现的效率和准确性。
技术关键词
数据特征选择方法
特征值
矩阵
特征选择算法
医学
患者
冗余特征
拉普拉斯
可读存储介质
处理器
文本
多标签
存储器
计算机
参数
电子设备
系统为您推荐了相关专利信息
光纤光谱仪
光谱检测方法
可调谐激光器
待测光源
衍射光栅
机器学习算法
可视化特征
噪声
信息可视化方法
分支
多模态深度学习
识别方法
矩阵
编码器
单细胞转录组
纤维混凝土
界面过渡区
水泥砂浆
三维物理模型
多面体