优化神经网络模型推理性能的方法和计算设备

正文

推荐专利

申请号：CN202411596094

申请日期：2024-11-11

公开号：CN119106705B

公开日期：2025-03-04

类型：发明专利

摘要

本发明提供一种优化神经网络模型推理性能的方法和计算设备，所述方法包括：对神经网络模型的有向图结构进行预跑处理；获取输入数据；从所述算子执行队列依次调度算子对所述输入数据进行推理计算。预跑处理包括：从所述有向图结构中依次获取每层的每个算子；判断所述算子的类型，所述算子的类型包括：常量算子、变形算子、硬件算子以及除以上三种算子以外的自定义算子；根据所述算子的类型对所述算子进行分类处理；根据分类处理的结果，将处理后的所述算子添加到算子执行队列。根据本发明的技术方案能够优化神经网络模型的加载流程，缩短模型推理耗时，降低模型电力消耗。

技术关键词

优化神经网络模型有向图结构人工智能芯片队列操作系统内存动态内存池自定义算子参数分区管理数据中央处理器分块标志核心键值

系统为您推荐了相关专利信息

一种无源光网络时间敏感业务传输方法及系统

时间敏感业务光网络单元终端设备传输方法队列

一种消费金融关系图谱系统

图谱数据处理模块数据分析模块数据可视化数据存储模块

用户态文件系统的性能优化方法及自服务模型

内核文件系统性能优化方法进程参数数据

一种基于人工智能的基建危大工程风险防控系统

风险防控系统基建天气地基沉降量预警模块

基于边缘计算环境下相关性的任务分区实时功耗调度方法

边缘计算环境访问共享资源调度算法分区 EDF算法

优化神经网络模型推理性能的方法和计算设备

站点导航

APP 下载