摘要
本发明涉及一种应用于异构训练集群的故障检测方法,包括:基于定义的统一接口,启动检测流程;执行分组通信检测流程,若检测出故障节点,则输出检测结果、并结束当前检测流程,否则执行分组训练检测流程,并输出检测结果、结束当前检测流程。与现有技术相比,本发明能够准确高效检测出故障节点,解决单一通信检测检出率低、单一训练检测耗时久且成本高的问题,同时支持大规模异构训练集群的故障检测,能够支持任意的芯片,减少应用于异构训练集群的故障检测复杂度。
技术关键词
故障检测方法
检测出故障节点
通信检测功能
异构
集群
自定义脚本
接口
信息数据结构
标识符
芯片
复杂度
标记
系统为您推荐了相关专利信息
智能算法模块
操控系统
设备状态监测
数字孪生
模块化系统
时空融合特征
多模态特征融合
多模态网络
时序特征
疲劳评估方法
参数
虚拟电厂双层优化模型
互补发电系统
光伏发电出力
图表
智能体模型
异构多智能体
仿真平台
控制测试系统
线性二次型调节器
局部优化算法
执行效能
协商模型
决策方法
构造飞行器