摘要
本申请实施例提供了一种注意力机制计算的优化方法、设备、存储介质及程序产品,涉及人工智能技术领域,该方法包括:对注意力机制计算的计算图进行切分,获得多个计算子图。然后将每个计算子图编译成对应的核函数,并执行每个计算子图对应的核函数,获得注意力机制计算的目标计算结果。由于获得的多个计算子图的数量小于计算图包含的算子的数量,因此,相较于将计算图中每个算子编译成一个核函数来说,将计算图中每个计算子图编译成一个核函数的这种方式,减少了编译得到的核函数的数量,从而在注意力机制计算过程中,减少核函数发射的时间开销,进而提升注意力机制计算的性能。
技术关键词
注意力机制
人工智能芯片
计算机设备
计算机程序产品
可读存储介质
人工智能技术
存储器
指令
数据
系统为您推荐了相关专利信息
电力系统培训
虚拟现实环境
立体模型
仿真场景
虚拟现实设备
特征提取方法
特征提取模块
输出特征
加权特征
融合特征
终端设备
指环
模式
虚拟现实可穿戴设备
生物特征数据