摘要
本发明涉及人工智能技术领域,提供一种矩阵乘性能优化方法、装置、电子设备和存储介质,其中方法包括:确定用于切分矩阵的切片形状;基于切片形状,对多个矩阵乘的输入矩阵进行切分,得到各输入矩阵的切片,多个矩阵乘的输入矩阵共用第一矩阵且多个矩阵乘的输入矩阵均包括第二矩阵;加载第一矩阵的切片和各矩阵乘中第二矩阵的切片,并基于第一矩阵的切片和各第二矩阵的切片,进行矩阵乘计算,得到各矩阵乘的输出矩阵切片。本发明通过基于确定的切片形状对多个矩阵乘的输入矩阵进行统一切分,可以使得多个矩阵乘共用的第一矩阵的每个切片只需被加载一次,即可在后续的多个矩阵乘计算中被多次复用,从而减少了加载开销,提高了计算性能和效率。
技术关键词
矩阵
性能优化方法
切片
非暂态计算机可读存储介质
指令
电子设备
人工智能技术
处理器
坐标
存储器
流水线
内核
索引