摘要
本发明公开了一种基于深度学习的边缘集群系统的监控方法及系统,涉及智能系统技术领域,包括收集系统中的容器节点运行和服务程序运行情况数据,并将运行数据上传和存储存储至系统存储服务器并构建边缘集群系统拓扑图;根据边缘集群系统拓扑图,构建对比网络获取节点的异常和边的异常;根据节点的影响因子,计算每个节点的重要性评分;根据重要性评分对节点的运行数据分配权重,构建训练集,根据训练集训练所述对比网络,直至对比网络的损失函数小于设定阈值;利用训练好的对比网络,根据系统的实时运行状态,实时监测系统的整体状态,当检测到异常时,触发警报机制。本发明能够提高异常检测的精度和可靠性的同时,避免不必要的计算资源的消耗。
技术关键词
集群系统
节点
监控方法
拓扑图
构建训练集
实时监测系统
网络
数据收集模块
空间布局信息
系统设备
存储服务器
收集系统
模型训练模块
因子
层级
多层感知机
邻居