摘要
本发明涉及操作系统领域,特别是涉及一种AI服务器操作系统故障检测和恢复的方法和装置。主要包括:将硬盘文件系统作为操作系统启动时的引导方式,监控管理模块与硬盘文件系统中的硬盘监测模块之间交互第一心跳包,根据第一心跳包获取操作系统的启动状态;监控管理模块与BIOS之间建立第二心跳包交互,监控管理模块通过第二心跳包将启动状态反馈至BIOS,当启动失败时,BIOS将引导方式切换至内存文件系统,通过内存文件系统中预存的系统根文件进行操作系统启动。本发明可以有效降低操作系统内核无法正常启动和根文件系统以及无法正常加载这两种致命服务器操作系统故障的影响,避免服务器启动故障导致的损失。
技术关键词
监控管理模块
内存文件系统
服务器操作系统
硬盘文件系统
操作系统启动
操作系统故障检测
监测模块
AI服务器
计算机可执行指令
标识
操作系统内核
周期性
控制服务器
处理器
计算机存储介质
系统为您推荐了相关专利信息
检修功能
管理器
文件系统分区
备份
虚拟文件系统
固件方法
编码模块
编码规则
生成配置文件
服务器操作系统
供墨系统
墨水桶
监控管理模块
打印机墨盒
智能控制模块