摘要
本申请涉及一种大数据集群任务监控方法、装置、设备及存储介质,基于实时采集的多个引擎的引擎数据,计算不同引擎对的资源争用度,生成资源竞争度矩阵;基于预训练的时序预测模型预测多个引擎各自对应的引擎指标基线预测值,并将多个引擎各自对应的实时引擎指标值与引擎指标基线预测值进行对比,若实时引擎指标值不满足引擎指标基线预测值,则获取目标引擎对应的异常分类模型进行根因诊断,确定引擎指标异常类型;基于引擎指标异常类型,确定恢复策略集,并基于资源竞争度矩阵,分别对恢复策略集中的每个恢复策略进行评分处理,基于评分结果,确定并执行最优恢复策略;与现有技术相比,本申请的技术方案能提升集群稳定性与运维效率。
技术关键词
时序预测模型
策略
内存
集群
指标
监控方法
生成资源
基线
大数据
矩阵
网络
执行冲突检测
依赖关系分析
计算机设备
序列
模块
监控装置
处理器
系统为您推荐了相关专利信息
火电机组智能
LSTM模型
改造方法
调度优化模型
遗传算法求解
服务管理方法
异构资源池
云端控制器
数字孪生
动态无功功率补偿
指令识别方法
智能农业
农业作业设备
自然语言
作业策略
功率预测方法
预测风力发电
补丁
特征选择
路由器