摘要
本申请提供了一种面向边缘计算场景的通用神经网络模型部署优化方法及系统,解决了现有为降低延时在边缘环境下部署神经网络模型的过程中,由于加速算子的差异使得软件的泛化性差、无法适应差异性大的不同硬件技术问题。其包括解析并序列化神经网络模型,提取层次信息并转换为中间表示,构建有向图,根据有向图中每个网络操作映射到目标硬件的功能模块并分配内存,进行标准化输出Loadable文件;将Loadable文件中输入、输出张量绑定到内存中,提交并选择推理任务在目标硬件上执行并调度,实现了算子融合。本申请可广泛应用于边缘计算技术领域。
技术关键词
神经网络模型
部署优化方法
场景
功能模块
内存
边缘计算技术
阶段
内核态
元素
资源
关系
参数
格式
软件
标记
框架
系统为您推荐了相关专利信息
双向长短期记忆网络
面向数据中心
语音降噪方法
多尺度
Sigmoid函数
车辆检测方法
计算机可存储介质
车辆检测系统
数据
图像
动态照片
应用程序框架
硬件抽象层
相机
计算机程序代码
时钟缓冲器
智能平台管理总线
控制单元
刀片
显示接口