摘要
本发明属于人工智能芯片技术领域,具体涉及一种基于深度优先调度技术的卷积神经网络编译器。本发明卷积神经网络编译器包括:配置模块、前端处理模块、层融合组划分模块、深度优先调度模块、成本模型模块、和代码生成模块;该编译器将ONNX模型转化为内部计算图,采用动态规划算法划分层融合组,对各层融合组采用新型深度优先调度技术实现算子切割及调度。本发明可有效提升神经网络编译效果,减少冗余计算,实现更充分的片上数据重用,从而提升卷积神经网络在资源受限的神经网络加速器上的推理速度。
技术关键词
策略
动态规划算法
神经网络加速器
内存
人工智能芯片技术
创建数据结构
节点
硬件配置信息
新型深度
接收前端
关系
输出特征
代表
定义
控制模块
分块
冗余
系统为您推荐了相关专利信息
体构建方法
智能合约代码
自然语言
大语言模型
数据存储
康复训练系统
扩展卡尔曼滤波
多信息
运动姿态数据
反馈控制策略
大语言模型
训练样本集
数据集构建方法
优化训练数据
生成提示词
内存控制器
存储模块
存储芯片
网状拓扑结构
路由器
生成训练数据
点检测方法
文本
预训练方法
区别技术