一种面向可重构AI芯片的神经网络推理部署方法和系统

正文

推荐专利

申请号：CN202510108830

申请日期：2025-01-23

公开号：CN119918676B

公开日期：2025-10-21

类型：发明专利

摘要

本发明公开了一种面向可重构AI芯片的神经网络推理部署方法，通过使用深度学习框架对应的ONNX库将训练好的模型导出为ONNX格式，对ONNX格式模型进行解析以获取网络拓扑结构、算子信息和总控信息，根据算子信息对每个算子进行划分得到划分结果；结合网络拓扑结构对算子划分结果进行组装拼接获取任务信息等步骤，充分利用可重构AI芯片的硬件资源；最终将总控信息和所有算子的任务信息组织成最终的可执行文件，高效完成神经网络模型在可重构AI芯片上的推理部署。本发明能够解决现有开发特定AI芯片架构编译器开发门槛高，效率低的技术问题，以及现有自动代码生成方法可能无法充分利用芯片性能的技术问题。

技术关键词

面向可重构神经网络推理网络拓扑结构深度学习框架输出特征基础自动代码生成方法格式分块计数器模块尺寸芯片架构神经网络模型通道组织门槛数据

一种面向可重构AI芯片的神经网络推理部署方法和系统

站点导航

APP 下载