摘要
本申请实施例提供了一种基于专家并行的张量确定方法、设备及存储介质,涉及人工智能芯片技术领域,该方法包括:在输入张量的隐藏层维度,将输入张量拆分为N个子张量;将N个子张量分配到N个计算单元各自部署的专家子网络并行计算。由于每个专家子网络是通过相应的第一权重参数对分配的子张量进行计算,因此,专家子网络的第一权重参数与分配的子张量在形状上是需要适配的;基于此,针对第一权重参数中与子张量的隐藏层维度关联的目标维度,将该目标维度的长度设置为子张量的隐藏层维度的长度,这样减小了第一权重参数在目标维度的长度,即减少专家子网络的权重参数本身需要占用的显存空间,从而降低显存的存储压力。
技术关键词
参数
计算机设备
人工智能芯片技术
计算机程序产品
优化器
可读存储介质
网络分配
中央处理器
精度
存储器
数据
指令
文本
语音
图像
压力
系统为您推荐了相关专利信息
光学元件参数
光学调制层
神经网络架构
移动平台
能量控制
信号模拟装置
高速开关
频率
光电耦合单元
接近开关
坐标系
模板
牙列间隙
计算机执行指令
ICP算法
环境感知数据
机器人控制系统
图像编码器
数据处理方法
对象