摘要
本申请公开了一种灰色故障处理方法、设备、介质及程序产品,涉及检测技术领域,包括采集所有服务器节点的性能数据;根据所有服务器节点的性能数据以及图神经网络模型对服务器集群中出现灰色故障的服务器节点进行检测;响应于服务器集群中任意一台服务器节点出现灰色故障,则通过单节点灰色故障检测算法对第一服务器节点的灰色故障进行校验;响应于第一服务器节点的灰色故障校验正确,则通过服务器节点健康评分机制以及网络链路的拓扑模型确定目标迁移服务器节点;将第一服务器节点的计算任务迁移至目标迁移服务器节点。本申请对服务器集群中的灰色故障检测,显著提升灰色故障检测速度和准确性,减少人工检测的需求,提升了整体系统的可靠性。
技术关键词
服务器节点
神经网络模型
服务器集群
融合时空特征
故障检测算法
累计偏差
评分机制
网络性能数据
历史性能数据
图形处理器
指标
动态时空特征
Sigmoid函数
网络通信链路
监控单元
矩阵