摘要
本申请公开了一种云平台故障检测及运维系统、方法、设备及存储介质,涉及云计算领域,包括:告警信息推送模块,用于配置告警推送,以便将告警信息推送至计算节点评估模块;计算节点评估模块,用于对告警信息进行筛选,确定目标告警,基于目标告警及预设评估项对计算节点进行评估,获取评估结果;故障恢复模块,用于基于评估结果确定对虚拟机执行的故障恢复操作,监测云平台集群的剩余资源,若剩余资源大于或等于目标阈值,则基于故障恢复操作向云平台集群发送故障恢复指令,监控云平台集群基于故障恢复指令的动作执行结果,以便基于动作执行结果进行相应的操作,完成对云平台的故障检测及运维。本申请实现了无人值守准确高效的故障恢复。
技术关键词
云平台集群
网络连通性检测
逻辑卷管理
故障检测
云平台故障
节点
故障恢复模块
策略
光纤
智能平台管理接口
虚拟机系统盘
告警系统
分布式文件系统
监控云平台
通道
宕机
日志
系统为您推荐了相关专利信息
新能源汽车电池
故障检测方法
电池单体
绝缘电阻测试仪
电池内阻测试仪
故障检测方法
配电柜
数据关联性分析
数据采集网络
多模态数据融合
继电保护测试系统
继电保护出口压板
卷积神经网络识别
信号特征
矩阵
配电网故障
隔离故障
配电网拓扑识别
重构
三相电压幅值
电磁干扰数据
通信故障检测
故障诊断模型
稳定性方法
矩阵