摘要
本发明涉及一种基于多模型融合的硬盘故障预测方法及系统,方法包括:获取不同型号硬盘的硬盘SMART数据;基于渐进窗口采样方式对硬盘SMART数据进行特征提取,得到初始特征集;利用极端随机树模型对初始特征集进行特征选择,得到最优特征集;通过最优特征集对多个机器学习模型进行训练,得到基于多模型融合的硬盘故障预测模型;当需要对目标型号硬盘进行故障预测时,获取目标型号硬盘的当前SMART数据,提取得到当前特征集;将当前特征集输入基于多模型融合的硬盘故障预测模型,输出目标型号硬盘的故障预测结果。充分利用机器学习集成模型的特征提取能力和时序建模能力,捕捉不同型号硬盘各SMART属性的变化过程,提高硬盘故障预测准确率。
技术关键词
硬盘故障预测方法
多模型
机器学习模型
随机森林模型
算法模型
特征选择
预测系统
皮尔逊相关系数
分类器
模型训练模块
特征提取模块
数据获取模块
特征提取能力