摘要
本申请提供一种云原生人工智能系统中的RDMA网络监控方法和系统,属于云原生技术领域。该方法由容器化部署在云原生平台的各个节点上的网络监控组件执行,网络监控组件包括:交换机监控模块和集群监控模块,该方法包括:使用交换机监控模块和集群监控模块分别采集各个RDMA交换机的第一流量数据和云原生平台各个节点上的第二流量数据,结合云原生平台的资源身份信息,识别出流量数据各自的流量身份,实现流量与资源的身份映射,将上述流量数据转换为云原生平台网络指标的数据格式,以便能够使用云原生平台方式进行处理和分析。该方法从AI任务的视角构建一套贯穿云原生平台与RDMA物理设备的全方位、可追溯的安全观测体系,且有良好的兼容性和可维护性。
技术关键词
集群监控
监控组件
交换机
监控模块
人工智能系统
网络监控方法
平台
身份
LLDP协议
数据格式
节点
告警模块
网络监控系统
网络拓扑
资源
原生技术
指标
系统为您推荐了相关专利信息
可信计算技术
执行控制系统
可信执行环境
硬件安全模块
可信硬件
子模块
服务系统
电子地图
移动端单点登录
监控模块
仿真测试平台
通信接口模块
数据可视化
协议
数据存储模块
环境智能监测系统
能见度传感器
气象传感器
智能通讯终端
监测机柜