摘要
本发明公开了一种神经网络模型的算子调度方法及系统,所述方法包括:步骤1,搜集神经网络模型中每个算子的切分方案,并从中筛选得到唯一的切分方式,以确保算子在执行时内存消耗不超过单个计算核心的片上空间大小;步骤2,按照拓扑顺序遍历神经网络的所有子图,形成拓扑序列,并根据子图的切分信息合并子图,形成子图组;步骤3,执行动态规划算法,查找并确定神经网络模型的最优调度序列;步骤4,根据记录的最优调度信息,生成动态调度序列,并根据启发式贪心规则确定每个子图组所对应的计算核心编号。通过合理的算子调度,本发明不仅提升了计算效率,还进一步缩短了神经网络推理过程的时间延迟,从而实现了更高效、更快速的神经网络计算。
技术关键词
神经网络模型
动态规划算法
数据依赖关系
核心
序列
神经网络推理
因子
内存
调度系统
分支
模块
策略
中子
芯片
系统为您推荐了相关专利信息
风险识别模型
人工智能模型
企业
税务申报表
长短记忆神经网络
对话生成方法
策略
异构
双向注意力
对话生成模型