摘要
本发明公开了一种用于服务器集群的故障根因定位方法及系统,涉及网络故障诊断技术领域;本发明通过精确时间协议实现微服务调用链、容器指标、物理节点及网络数据的纳秒级同步采集,经实体关联与标准化处理构建一致数据集;基于此动态构建服务‑资源拓扑图,创新设计服务间调用边权重模型:融合实时负载因子与经Sigmoid函数处理的历史故障指数衰减和,周期性更新权重以精准量化节点间影响强度;将拓扑图转化为贝叶斯网络;故障发生时,采用三级流水线压缩告警,通过位图索引与并行FP‑Growth挖掘频繁项集,结合拓扑边权重与KL散度筛选强因果关联项集;以强因果告警为证据,通过反向随机游走采样输出概率化根因排序,实现复杂分布式系统故障的高精度定位。
技术关键词
服务器集群数据
拓扑图
推理网络
定位方法
动态更新
精确时间协议
节点
网络故障诊断技术
权重模型
因子
Sigmoid函数
关系
挖掘频繁项集
流水线
监控指标数据
异常数据处理
强度