摘要
本申请实施例提供了一种矩阵乘算子的优化方法、设备、存储介质及程序产品,涉及人工智能技术领域,该方法包括:在执行矩阵乘算子之前,确定矩阵乘算子的多个输入矩阵各自在内存中的目标布局方式以及矩阵乘算子的目标相乘方式,使得目标布局方式和目标相乘方式支持在矩阵乘算子的执行过程中采用连续访存方式从内存中读取多个输入矩阵。这样,在矩阵乘算子的执行过程中,人工智能芯片可采用连续访存方式读取多个输入矩阵(即读取在内存中连续存储的数据)进行矩阵乘计算;相较于读取非连续存储数据来说,人工智能芯片对连续存储数据的读取性能更高,这样有效提高了矩阵乘算子执行过程中的数据读取效率,从而提高矩阵乘算子的计算效率。
技术关键词
布局方式
矩阵
人工智能芯片
访存方式
计算机设备
内存
计算机程序产品
数据读取效率
时钟
可读存储介质
人工智能技术
周期
存储器
参数
指令
系统为您推荐了相关专利信息
电力负荷预测方法
周期性
镜像滤波器
低通滤波器
序列
变形分析方法
屋盖钢结构
金属屋面系统
节点
Delaunay三角剖分
多层感知器
形态滤波器
条纹缺陷
图像处理算法
工业相机
机器人操纵方法
三维坐标信息
末端执行器
动作预测模型
三维姿态信息
相位畸变校正方法
Dijkstra算法
深度学习网络
血流速度信息
成像