摘要
本申请涉及一种大数据组件的自愈运维方法、装置、设备及存储介质,通过对大数据组件的多模态数据进行预处理和特征融合,得到并将高维组件健康状态向量输入到故障诊断大模型中,输出目标故障类型和根因置信度;当根因置信度满足预设置信度阈值时,基于目标故障类型,确定历史修复策略,基于当前集群环境的集群环境特征参数与历史修复策略,计算集群环境相似度,若集群环境相似度满足预设集群环境相似度阈值,则将历史修复策略作为候选修复策略;若否,则基于强化学习策略生成引擎生成候选修复策略,基于候选修复策略匹配的策略级别执行候选修复策略;与现有技术相比,本申请的技术方案能有效解决传统运维的漏检、低效、固化等问题。
技术关键词
集群
多模态
性能指标数据
强化学习策略
结构化日志数据
时序
大数据
运维方法
置信度阈值
多头注意力机制
数据处理模块
故障诊断模块
编码器
规模
分层特征提取
核心
软件
系统为您推荐了相关专利信息
智慧教学管理方法
个性化教学
注意力
教学管理装置
学生学习状态
超声信号
多模态
激励超声换能器
计算机可执行指令
信号预处理模块
通信机器
非对称网络架构
树形网络拓扑结构
集合通信方法
层级
采集网关
CPU模块
内存模块
存储模块
异构计算模块
电力监控系统
运维场景
管理方法
关键监测参数
实时监测数据