摘要
本发明涉及人工智能技术领域,提供一种可观测性容器集群故障运维方法、装置、设备及介质,一方面,采用微服务解耦架构构建可观测性容器集群故障运维系统,能够实现各功能层间的解耦,各功能层协同执行任务,提高了系统的扩展性及任务执行效率;一方面,根据可观测性指标数据间的关联分析结果进行特征构建,不仅能够通过外部可见信息预测系统内部状态,且构建的特征具有明显的关联,能够提高后续故障预测的准确性;另一方面,根据动态阈值及具有时序性的故障预测模型进行故障预测,并自动执行自愈策略,能够结合人工智能手段及动态阈值机制进行更准确地故障预测,同时提供自动化的自愈策略,从而提高系统稳定性。
技术关键词
集群故障
故障预测模型
运维方法
运维系统
容器
数据采集层
指标
事件关联分析
运维装置
信息预测系统
计算机设备
策略
关联分析算法
决策
动态
分布式协同
构建训练集
阈值机制