摘要
本公开提供一种神经网络模型的推理方法及装置,涉及人工智能技术领域。该方法包括:将神经网络模型的第一图结构在预设的维度切分成多份切片;在每一份切片中插入辅助算子并通过辅助算子将每一份切片链接,得到第二图结构;将所述第二图结构加载到神经网络处理器的运算单元进行推理。本公开提供的神经网络模型的推理方法及装置,先在每一份切片中插入辅助算子并通过辅助算子将每一份切片链接,再将处理后的图结构加载到神经网络处理器的运算单元进行推理,避免了神经网络模型的图结构直接被切分后,切片中的算子映射到运算单元时的重复计算,提高了处理器的计算效率,提升了处理器的性能。
技术关键词
神经网络模型
推理方法
切片
神经网络处理器
推理装置
人工智能技术
计算机程序产品
可读存储介质
存储器
电子设备
模块
通道
系统为您推荐了相关专利信息
粒度检测方法
球团矿
图像嵌入
BP神经网络模型
图像编码器
热防护结构
结构设计方法
人工神经网络模型
训练机器学习模型
遗传算法
多维特征数据
能量管理
混合神经网络模型
回收方法
压缩机余热回收
复合探测装置
激光发射单元
激光驱动电路
烟气
电子线路
预防监测系统
功率谱密度估计
心率
患者
数据收集单元