摘要
本发明公开一种众核环境下自适应的dw类型算子数据分布方法和装置,通过获取参与计算的硬件设备参数以及计算任务参数,根据x和dy的形状搜索适应硬件设备参数的数据分布;根据数据分布和单次取数大小,将输入数据划分为多个块进行计算,最后根据得到的数据分布选择规约维度和连接写回维度写回。本发明能够针对计算芯片和参与计算的数据参数,自适应的搜索适应计算的数据分布,从而减少了因数据分布不合理导致的额外数据传输的开销,从而优化了算子性能。
技术关键词
数据分布方法
硬件设备
众核环境
参数
数据分布装置
对象
模块
关系
策略
矩阵
芯片
通道
尺寸