摘要
本发明属于计算机技术领域,提供了一种AI服务器故障定位的方法,包括:基本输入输出系统BIOS初始化设备,构建包含系统PCIE逻辑拓扑树的系统逻辑拓扑信息,并将其推送至基板管理控制器BMC;系统故障状态触发,BIOS收集错误触发设备信息并识别错误类型,确定待检测设备范围;BIOS对待检测设备范围内的设备依次检测,结合系统逻辑拓扑信息定位最终根因故障设备。本发明提供的AI服务器故障定位的方法,可精准定位故障源,并记录详细错误信息,有效解决发生故障后无法精准定位复现的问题,提升故障定位以及故障解决效率。
技术关键词
逻辑拓扑信息
AI服务器
基板管理控制器
输入输出系统
检测设备
系统管理中断
定位故障源
CPU板
数据
系统为您推荐了相关专利信息
散热控制系统
PWM控制器
温度传感器
周期
内存
数据样本集合
故障诊断模型
半监督学习
波形
训练设备
外观检测方法
外观检测装置
餐具信息
深度学习算法
外观检测设备
电子束检测设备
缺陷检测方法
光学邻近修正
图像处理模型
热点