摘要
本发明提供一种用于DPU的VirtIO‑Net动态故障检测方法及装置,包括:加载第一监控模块至内核,使用第一监控模块扫描得到系统中正在运行的网络接口及其相关信息;使用内核动态调试工具监控VirtIO‑Net的收发包接口;在第一监控模块的预设函数中检测环形缓冲区的各个索引和描述符是否存在异常,若存在异常,则记录当前时刻环形缓冲区的信息,并主动通知第二监控模块;第二监控模块获取直接内存访问硬件模块的信息;根据环形缓冲区的信息、直接内存访问硬件模块的信息分析故障,生成分析报告,并将分析报告发送至告警平台,以通知运维人员。本发明提供的方法能够快速定位故障点,解决故障问题,保障数据中心的连续运行和服务质量。
技术关键词
动态故障检测
监控模块
环形缓冲区
告警平台
网络接口
调试工具
描述符
内存
硬件平台
内核
分析故障
通知
虚拟机管理程序
报告
片上系统
索引
定位故障点
队列
位置指针