摘要
本申请公开一种算子执行方法、装置、计算机设备及存储介质,属于人工智能技术领域,该方法中,获取到融合算子中第一运算的第一精度的输出结果后,按照预设数据排布方式将输出结果存储到TLR阵列中,基于预设数据排布方式将TLR阵列中的数据从第一精度转换到第二精度,第二精度是融合算子中第二运算对应的输入精度,在确定转换后的数据满足第二运算对应的数据排布要求后,通过各线程处理数据以得到融合算子的计算结果,处理是根据第二运算的类别确定的。这样,改变融合算子中前一运算的输出结果在输出时的数据排布方式,精度转换后即可满足下一运算对应的数据排布要求,不必对线程间的数据进行交换,硬件开销比较小,故可提升融合算子的性能。
技术关键词
排布方式
人工智能芯片
数据
空闲存储空间
精度
阵列
计算机设备
人工智能技术
计算机程序产品
执行装置
输出模块
存储器
核心
处理器
系统为您推荐了相关专利信息
人体监测系统
人体健康状态
脉搏传感器
人体监测方法
人体手腕
无损检测探头
灵敏度矩阵
线圈传感器设计
传感器阵列配置
数值计算方法
面向交通场景
矩阵
分块
交通仿真平台
交通控制系统
残差神经网络
室内指纹定位方法
残差模块
优化网络参数
链路