一种应用于异构训练集群的故障检测方法

AITNT
正文
推荐专利
一种应用于异构训练集群的故障检测方法
申请号:CN202510221820
申请日期:2025-02-27
公开号:CN120371576A
公开日期:2025-07-25
类型:发明专利
摘要
本发明涉及一种应用于异构训练集群的故障检测方法,包括:基于定义的统一接口,启动检测流程;执行分组通信检测流程,若检测出故障节点,则输出检测结果、并结束当前检测流程,否则执行分组训练检测流程,并输出检测结果、结束当前检测流程。与现有技术相比,本发明能够准确高效检测出故障节点,解决单一通信检测检出率低、单一训练检测耗时久且成本高的问题,同时支持大规模异构训练集群的故障检测,能够支持任意的芯片,减少应用于异构训练集群的故障检测复杂度。
技术关键词
故障检测方法 检测出故障节点 通信检测功能 异构 集群 自定义脚本 接口 信息数据结构 标识符 芯片 复杂度 标记
系统为您推荐了相关专利信息
1
基于5G与AI的数字孪生装载机低延时操控系统
智能算法模块 操控系统 设备状态监测 数字孪生 模块化系统
2
一种基于可穿戴传感信息融合的客观体力疲劳评估方法
时空融合特征 多模态特征融合 多模态网络 时序特征 疲劳评估方法
3
虚拟电厂外特性参数处理方法、装置、设备及介质
参数 虚拟电厂双层优化模型 互补发电系统 光伏发电出力 图表
4
异构多智能体协作控制测试系统、方法及电子设备
智能体模型 异构多智能体 仿真平台 控制测试系统 线性二次型调节器
5
一种基于聚类协商的多簇飞行器目标分配容错决策方法
局部优化算法 执行效能 协商模型 决策方法 构造飞行器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号