优化神经网络模型推理性能的方法和计算设备

AITNT
正文
推荐专利
优化神经网络模型推理性能的方法和计算设备
申请号:CN202411596094
申请日期:2024-11-11
公开号:CN119106705B
公开日期:2025-03-04
类型:发明专利
摘要
本发明提供一种优化神经网络模型推理性能的方法和计算设备,所述方法包括:对神经网络模型的有向图结构进行预跑处理;获取输入数据;从所述算子执行队列依次调度算子对所述输入数据进行推理计算。预跑处理包括:从所述有向图结构中依次获取每层的每个算子;判断所述算子的类型,所述算子的类型包括:常量算子、变形算子、硬件算子以及除以上三种算子以外的自定义算子;根据所述算子的类型对所述算子进行分类处理;根据分类处理的结果,将处理后的所述算子添加到算子执行队列。根据本发明的技术方案能够优化神经网络模型的加载流程,缩短模型推理耗时,降低模型电力消耗。
技术关键词
优化神经网络模型 有向图结构 人工智能芯片 队列 操作系统内存 动态内存池 自定义算子 参数 分区管理 数据 中央处理器 分块 标志 核心 键值
系统为您推荐了相关专利信息
1
一种无源光网络时间敏感业务传输方法及系统
时间敏感业务 光网络单元 终端设备 传输方法 队列
2
一种消费金融关系图谱系统
图谱 数据处理模块 数据分析模块 数据可视化 数据存储模块
3
用户态文件系统的性能优化方法及自服务模型
内核文件系统 性能优化方法 进程 参数 数据
4
一种基于人工智能的基建危大工程风险防控系统
风险防控系统 基建 天气 地基沉降量 预警模块
5
基于边缘计算环境下相关性的任务分区实时功耗调度方法
边缘计算环境 访问共享资源 调度算法 分区 EDF算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号