摘要
本申请实施例提供了一种融合算子优化方法、设备及存储介质,涉及人工智能芯片技术领域,该方法包括:第一人工智能芯片获取第一数据块在目标布局下的第一写出地址;从第一显存中读取第一数据块,并将第一数据块保存在第一写出地址。获取第二数据块在目标布局下的第二写出地址;基于第二写出地址以及原始布局与目标布局之间的地址映射关系,获得第二数据块在第二显存中的第二读取地址;按照第二读取地址从第二显存中读取第二数据块,并直接将第二数据块保存在第二写出地址,同时实现对远端数据进行布局重排以及本地数据与远端数据的全局聚合,额外减少了一次数据搬运操作中的读写过程,从而提高算子执行效率。
技术关键词
数据
地址映射关系
布局
计算机设备
人工智能芯片技术
计算机程序产品
可读存储介质
指令
存储器