摘要
本发明涉及GPU芯片测试领域,具体为一种面向大算力GPU芯片的并行测试任务调度方法。具体实现过程包括:构建测试任务‑资源需求矩阵,计算测试任务产生的瞬态热应力并校验测试安全裕度;根据测试安全裕度将多个测试任务聚合为并行测试执行簇,为并行测试执行簇规划包含空间映射与执行时窗的GPU测试调度图;设置故障因果溯源链,在测试失败时进行解析,输出故障源上下文并排查故障原因。本发明通过构建测试任务‑资源需求矩阵,采用先规划、后执行的精细化调度方式并引入主动安全校验,在保障GPU芯片安全性的同时实现了对大算力GPU芯片的高效并行测试,有效提升了测试任务的执行效率以及故障定位的精确程度。
技术关键词
并行测试任务调度方法
并行测试执行
GPU测试
溯源信息
排查故障
日志数据流
矩阵
物理
芯片
数据依赖关系
规划
生成资源
功耗
节点
逻辑
热传导
核心
基线
系统为您推荐了相关专利信息
动力电池梯次
数据共享方法
全生命周期数据
节点
区块链模型
异常检测方法
门控神经网络
节点特征
溯源信息
长短期记忆网络
供热管道
动态报警阈值
动态报警方法
历史温度数据
土壤温度场