摘要
本发明涉及超算系统运维技术领域,公开了一种超算系统节点的智能化操作系统重置的方法,包括以下步骤:步骤101,实时采集超算系统每个计算节点的数据,数据通过RDMA高速网络传输至监控中心留存,形成历史运行数据,其中,历史运行数据包括历史指标时序数据和历史故障标签数据;步骤102,在历史运行数据中采用滑动窗口法生成三维数组,三维数组包括样本信息、时间信息和特征信息,将三维数组中的信息顺序拼接;步骤103,构建故障预测模型,将三维数组输入到故障预测模型中,故障预测模型输出故障概率。本发明通过构建故障预测模型,实时采集并处理超算系统节点数据,可预测故障发生概率,为超算节点操作系统重置提供智能化决策依据。
技术关键词
智能化操作系统
超算系统
故障预测模型
历史运行数据
指标
样本
滑动窗口法
计算机可读指令
时序特征
网络带宽测试
节点操作系统
注意力
文件系统
监控中心
标签
系统为您推荐了相关专利信息
故障实时检测方法
数据
滚动轴承
轴承早期故障检测
检测轴承
口腔健康
检验图像数据
评估系统
数据获取单元
诊断教学
风险评估方法
资产
无线数据采集网络
风险评估算法
特征数据库