摘要
本发明涉及一种面向端侧神经网络的部署方法及装置,方法包括:S1.分析神经网络模型中的神经网络算子,确定其中得不到目标处理设备中神经处理单元支持的受限算子;S2.根据所述受限算子生成替代算子,以所述替代算子替换所述神经网络模型中的所述受限算子;S3.将所述神经网络模型部署至目标设备。具备提高深度神经网络模型与移动设备之间的匹配度,提高深度神经网络模型在移动设备中的推理效率,降低推理延时和推理功耗等优点。
技术关键词
神经处理单元
多层感知机
深度神经网络模型
规模
受限
矩阵
核心
移动设备
存储器
处理器
滤波器
精度
功耗
策略
参数
系统为您推荐了相关专利信息
自动部署方法
多学科优化平台
计算机网络集群
神经网络模型
负载均衡器
节点
网络生命周期
无线传感网路
分布式存储集群
监控网络设备
图像缺陷识别方法
缺陷特征提取
模糊特征
噪声特征
融合特征
自动翻译方法
自动翻译系统
深度学习训练
深度学习算法
大规模并行计算技术