摘要
本申请实施例提供了一种卷积算子执行方法、设备、存储介质及程序产品,涉及人工智能技术领域,该方法包括:针对输入张量中任意相邻计算的第一处理区域和第二处理区域,先从显存中加载第一处理区域进行卷积计算,获得第一计算结果。然后确定第一处理区域与第二处理区域的重叠区域,并从显存中加载第二处理区域中除重叠区域之外的剩余区域,这样,基于重叠区域和剩余区域即可拼接成第二处理区域并对第二处理区域执行卷积计算,避免了重复加载重叠区域,有效降低了从显存中加载数据带来的耗时,从而提高卷积计算的效率,进而提高卷积算子的性能。
技术关键词
人工智能芯片
计算机设备
数据
计算机程序产品
可读存储介质
人工智能技术
存储器
指令
系统为您推荐了相关专利信息
数据采集设备
建筑施工基坑
三维特征提取
场景
网格
陀螺仪技术
定位系统
加速度
陀螺仪数据
空间运动分析
缺陷检测方法
神经网络模型
强化学习模型
缺陷预测
图像