摘要
本申请涉及一种加速卡算子适配方法、装置,通过将算子源代码放入预定文件夹;将所述算子源代码转化为抽象语法树AST;根据所述抽象语法树AST,利用MLIR工具生成Looplet dialect;根据加速卡的架构,在所述Looplet dialect内对加速卡算子进行优化;通过MLIR工具将所述Looplet dialect转换为affine dialect;基于所述affine dialect,采用多面体模型对所述加速卡算子进行优化;通过MLIR工具将所述affine dialect转化为llvm dialect;通过LLVM工具将llvm dialect转化为llvm IR;利用LLVM下LLC工具将llvm IR编译为可执行二进制文件。解决了现有技术不同架构的国产加速卡需要构建不同的算子,成本高,效率低的技术问题,达到了同一套算子源码优化后部署到不同架构的国产加速卡上,适配性高,成本低,效率高的技术效果。
技术关键词
多面体模型
加速卡
文件夹
计算机设备
适配装置
关系
计算机程序产品
处理器
输入模块
可读存储介质
存储器
平铺
数据
核心