摘要
本发明公开了一种基于指令拓扑关系感知的GEMM调优方法,该方法构建芯片参数模块,获取待优化算子,依据所有指令构建指令序列,并分为数据预取、矩阵乘运算、结果存回三部分。其次确定算子的搜索空间、起始解状态和矩阵乘运算中一个循环的期望执行时间的范围,对当前解状态及其相邻解状态分别构建指令拓扑关系图,将当前解状态作为候选解。然后基于贪心算法分别对当前解状态及其相邻解状态调整指令顺序。最后获取芯片的平均算力,并迭代循环,从候选解中选取平均算力最高的解状态作为该算子的最优解。本发明实现程序执行时间趋近于指令拓扑图中的关键路径长度,提高指令执行的效率,减少人工优化的时间。
技术关键词
访存指令
贪心算法
关系
矩阵
程序执行时间
全局存储器
芯片
序列
数据
拓扑图
参数
指标
模块
顶点
系统为您推荐了相关专利信息
症状向量
归因
注意力模型
矩阵
内容分发网络节点
波束赋形矩阵
高铁通信系统
LSTM神经网络
多普勒
信道