摘要
本发明公开了一种面向智算系统的性能预测方法,该方法通过混合分析建模,实现了高效且可解释的性能预测。该方法主要包括:对目标深度学习模型进行追踪与程序化合成,生成包含完整计算及通信操作序列的最终算子图;采用基于可用并行度的动态重叠分析模型,结合机器学习方法预测独立的计算与访存效率,精确估算GPU算子执行延迟;基于可配置的网络拓扑,应用排队论网络模型,对通信操作在网络路径中各节点的排队和传输延迟进行白盒式建模;将各算子的计算与通信预测延迟,根据分布式策略的调度特性进行聚合,得到最终系统端到端时延。本发明提出的方法,能够在显著缩短预测时间的同时保证精度,具有高效率、强可解释性等优点。
技术关键词
性能预测方法
分布式策略
深度学习模型
机器学习方法预测
网络拓扑结构
节点
流水线
并行策略
瓶颈
机器学习模型
多处理器
单层
序列
预测装置
存储器
网络通信
系统为您推荐了相关专利信息
异常检测方法
小麦籽粒
融合深度学习模型
短波近红外波段
光谱特征提取
照度测量方法
多光谱
校准
主动学习策略
Harris角点检测
细胞识别
计数方法
空间金字塔池化
组织切片图像
图像块
厚度检测方法
单体
多视角图像采集
钢材
分割掩模
重要性评估方法
高时空分辨率
深度学习网络
物候特征
地貌特征