摘要
本公开涉及人工智能芯片设计技术领域,具体涉及一种片上容错处理方法、系统、芯片及电子设备。该系统包括故障检测模块、故障诊断模块和故障修复模块。通过故障检测模块的监测部件收集芯片组件的监测数据,利用预设的故障模型判断芯片是否发生故障,若发生故障,获取包含故障组件的标识及故障数据的故障信息;故障诊断模块根据故障组件的标识确定故障位置,并基于故障数据评估故障组件的性能退化程度及其对芯片性能的影响,生成故障评估数据。故障修复模块则基于评估数据制定故障修复策略,实施故障修复。由此在芯片内部实现了故障的自动检测、精准诊断与高效修复,降低了因故障导致的系统停机时间和维护成本,有效提升了芯片的容错能力和可靠性。
技术关键词
处理器结构
故障诊断模块
故障检测模块
芯片组件
间歇故障
间歇性故障
监测电路
核心
性能计数器
人工智能芯片设计技术
数据
监测单元
可重新配置组件
策略
时序
多核处理器
老化故障
标识
系统为您推荐了相关专利信息
待测电路板
红外相机
基准
热异常检测
偏振滤光片
发光芯片
多通道
芯片组件
位移传感器结构
低反射
风机传动系统
故障估计方法
观测器
估计误差
邻域