摘要
本发明公开一种基于算子分块的神经网络模型并行优化方法及装置,包括硬件设备感知的算子分块过程和加权算子调度过程;硬件设备感知的算子分块过程包括:对神经网络模型进行展开,构建计算图;分析各设备的硬件特征,并据此建立各硬件设备的计算能力模型;遍历计算图,基于硬件设备的计算能力模型,对算子进行分块;加权算子调度过程包括:根据每个算子的分块方案,更新计算图,为每个算子节点赋予权值,计算图成为一个加权有向无环图;遍历计算图,计算每个算子节点的高度,并将高度作为算子节点的优先级;找到入度为0的算子节点集合,将其中优先级最高的节点放入执行队列,并在计算图中删除该节点和与节点相连的边,得到算子的有限拓扑序列。
技术关键词
硬件设备
并行优化方法
神经网络模型
节点
有向无环图
分块策略
异构设备
队列
通信接口
核心
处理器
优化装置
存储器
计算机
指令
序列
数据
流水线
电子设备
系统为您推荐了相关专利信息
因子
优化控制系统
控制器模块
行人信号灯
车辆信号灯
测量点
雷达点云数据
雷达料位计
进化算法
综合评价指标
调频连续波信号
步态特征
多普勒
步态识别
步态异常识别方法