摘要
本发明公开了一种高效评估算子性能的方法、装置、设备、介质及产品。该方法包括:在待评估算子为数据搬运及计算算子时,在获取待评估算子的多条切分策略后,根据与目标AI芯片适配的带宽模型和算子计算核性能模型,计算每条切分策略的数据搬运耗时和计算耗时后,初步计算待评估算子针对每条切分策略的算子总耗时;之后,根据初步计算的算子总耗时,筛选得到各备选切分策略后,通过运行带宽测试程序和计算核测试程序,测量每条备选切分策略的目标实测数据搬运耗时和目标实测计算耗时后,重新计算待评估算子针对每条备选切分策略的算子总耗时进行算子性能评估,本发明实施例的技术方案可以快速、准确且全面的评估出AI芯片的算子性能。
技术关键词
策略
芯片
存储特征
机器学习模型
重构
数据存储
计算机程序产品
流水线
模块
可读存储介质
关系
电子设备
处理器通信
存储器
组织
指令