摘要
本发明涉及一种scale out网络备份路径快速切换通知系统及方法,旨在解决现有VRRP/BFD协议切换时间无法满足AI服务器scale out网络高实时性需求的问题;该方案通过CPU+巡检FPGA+电源监控的协同架构实现:CPU运行VRRP/BFD协议栈并维护状态表,FPGA负责实时检测电源故障、端口故障及GPU告警,在1个主频周期内生成并发送预装报文;电源监控模块通过储能电容确保突发掉电后维持≥5ms供电,保障故障报文完整发送。其优点表现在:该系统支持多scale out接口冗余,采用低功耗交换芯片及独立最小电源域设计,实现故障检测与备份路径切换的端到端延迟≤1ms,显著提升AI服务器scale out网络的故障响应速度与可靠性,适用于高密度AI训练集群的网络连续性保障。
技术关键词
设备电源监控模块
CPU模块
BFD协议
交换模块
报文
检测电源故障
通知系统
AI服务器
备份
指令
监控设备供电
链路
端口
低功耗
网络
通知方法
电容单元
系统为您推荐了相关专利信息
CAN总线数据
车辆轨迹生成方法
加速度
卡尔曼滤波算法
轨迹生成系统
PWM占空比
比例控制阀
电流值
PID算法
电流闭环控制
活动组件
卷积神经网络模型
元素
对象检测算法
页面