一种AI服务器故障定位的方法

AITNT
正文
推荐专利
一种AI服务器故障定位的方法
申请号:CN202411067650
申请日期:2024-08-06
公开号:CN118885321A
公开日期:2024-11-01
类型:发明专利
摘要
本发明属于计算机技术领域,提供了一种AI服务器故障定位的方法,包括:基本输入输出系统BIOS初始化设备,构建包含系统PCIE逻辑拓扑树的系统逻辑拓扑信息,并将其推送至基板管理控制器BMC;系统故障状态触发,BIOS收集错误触发设备信息并识别错误类型,确定待检测设备范围;BIOS对待检测设备范围内的设备依次检测,结合系统逻辑拓扑信息定位最终根因故障设备。本发明提供的AI服务器故障定位的方法,可精准定位故障源,并记录详细错误信息,有效解决发生故障后无法精准定位复现的问题,提升故障定位以及故障解决效率。
技术关键词
逻辑拓扑信息 AI服务器 基板管理控制器 输入输出系统 检测设备 系统管理中断 定位故障源 CPU板 数据
系统为您推荐了相关专利信息
1
服务器的散热控制系统和服务器
散热控制系统 PWM控制器 温度传感器 周期 内存
2
设备故障诊断方法、装置、模型训练方法、设备及介质
数据样本集合 故障诊断模型 半监督学习 波形 训练设备
3
餐具外观检测方法、装置及设备
外观检测方法 外观检测装置 餐具信息 深度学习算法 外观检测设备
4
一种芯粒聚合缺陷检测方法及设备
图像 兴趣 缺陷检测方法 缺陷检测设备 光源
5
晶圆的缺陷检测方法、计算机程序产品及计算机设备
电子束检测设备 缺陷检测方法 光学邻近修正 图像处理模型 热点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号