摘要
本申请公开了一种基于人工智能的算力节点故障智能诊断方法及系统,涉及故障智能诊断领域,其首先通过提取与故障事件关联的特定时间窗口内的日志序列和指标序列,构建故障实例的上下文信息。随后,对提取出的日志和指标序列进行模态特定编码深度学习各自模态的内在特征表示。特别地,本方法采用多模态特征深度融合技术,将日志和指标的上下文表示向量进行融合,充分挖掘不同模态间的互补信息和关联性。最终,基于融合后的故障事件多模态特征来精准预测故障的根因类别及其置信度并生成可理解的根因描述文本,以此显著提升了诊断的准确性和可解释性,从而为大规模算力节点的稳定运行提供有力保障。
技术关键词
故障智能诊断方法
序列
日志
多模态特征融合
故障智能诊断系统
节点
指标数据编码
编码器
词嵌入模型
文本
校正
高斯核函数
分类器
数据获取模块
解码器