摘要
本发明提供一种优化神经网络模型推理性能的方法和计算设备,所述方法包括:对神经网络模型的有向图结构进行预跑处理;获取输入数据;从所述算子执行队列依次调度算子对所述输入数据进行推理计算。预跑处理包括:从所述有向图结构中依次获取每层的每个算子;判断所述算子的类型,所述算子的类型包括:常量算子、变形算子、硬件算子以及除以上三种算子以外的自定义算子;根据所述算子的类型对所述算子进行分类处理;根据分类处理的结果,将处理后的所述算子添加到算子执行队列。根据本发明的技术方案能够优化神经网络模型的加载流程,缩短模型推理耗时,降低模型电力消耗。
技术关键词
优化神经网络模型
有向图结构
人工智能芯片
队列
操作系统内存
动态内存池
自定义算子
参数
分区管理
数据
中央处理器
分块
标志
核心
键值
系统为您推荐了相关专利信息
时间敏感业务
光网络单元
终端设备
传输方法
队列
图谱
数据处理模块
数据分析模块
数据可视化
数据存储模块
边缘计算环境
访问共享资源
调度算法
分区
EDF算法