摘要
本发明公开了一种面向可重构AI芯片的神经网络推理部署方法,通过使用深度学习框架对应的ONNX库将训练好的模型导出为ONNX格式,对ONNX格式模型进行解析以获取网络拓扑结构、算子信息和总控信息,根据算子信息对每个算子进行划分得到划分结果;结合网络拓扑结构对算子划分结果进行组装拼接获取任务信息等步骤,充分利用可重构AI芯片的硬件资源;最终将总控信息和所有算子的任务信息组织成最终的可执行文件,高效完成神经网络模型在可重构AI芯片上的推理部署。本发明能够解决现有开发特定AI芯片架构编译器开发门槛高,效率低的技术问题,以及现有自动代码生成方法可能无法充分利用芯片性能的技术问题。
技术关键词
面向可重构
神经网络推理
网络拓扑结构
深度学习框架
输出特征
基础
自动代码生成方法
格式
分块
计数器
模块
尺寸
芯片架构
神经网络模型
通道
组织
门槛
数据