摘要
本申请实施例提供了一种计算图优化方法、设备、存储介质及程序产品,涉及人工智能技术领域,该方法包括:基于预设模板将编码模块的计算图切分为多个计算子图;基于人工智能芯片上的索引资源的资源量,获得子图合并粒度;再按照子图合并粒度,对多个计算子图进行汇编合并,获得至少一个合并子图,即在充分考虑人工智能芯片上的索引资源的情况下,将计算图切分成尽量少的合并子图,故将每个合并子图编译为相应的合并核函数并执行时,大大减少了合并核函数的数量,从而减少发射核函数的时间开销。其次,本申请不仅考虑了计算图本身包含的算子,同时结合了实际执行计算图的底层芯片的资源情况,使计算图达到最大优化,提高了计算图的优化效果。
技术关键词
人工智能芯片
计算机设备
编码模块
计算机程序产品
资源
索引
可读存储介质
人工智能技术
存储器
模板
指令
对象
系统为您推荐了相关专利信息
局部优化模型
迭代学习预测控制方法
车辆
控制策略
油耗
激光雷达特征点
回环检测方法
扩展卡尔曼滤波
多传感器融合
无人机
故障机器人
智能配送技术
机器人控制模块
计算机程序产品
处理器
任务分配策略
队列
时间序列特征
计算机设备
格式