摘要
本申请涉及一种大算力芯片计算架构的K维度张量切分方法、装置、设备、介质和产品。所述方法包括:在Transformer网络的训练过程中,将Transformer网络中的输入矩阵的转置矩阵按照列维度拆分为N个列输入转置向量;将Transformer网络中的输出矩阵按照列维度和行维度拆分成N2个第三输出元素;在N个不同计算设备中每个计算设备上,部署一组对应的列输入转置向量和输出矩阵中的N个第三输出元素;输出矩阵中包括N2个第三输出元素;基于集合通信的方式,经过N轮计算得到N个第三输出元素分别与各列输入转置向量之间的乘积和;整合每个计算设备上的乘积和,以得到权重梯度矩阵。采用本方法能够有效地减小Transformer网络训练的张量存储与通信开销。
技术关键词
元素
矩阵
网络
切分装置
计算机程序产品
处理器
芯片
计算机设备
模块
可读存储介质
存储器
系统为您推荐了相关专利信息
多视角特征融合
相机内部参数
图像块
人体拓扑结构
采样点
车辆轨迹跟踪方法
前轮
北斗差分定位
误差模型
坐标系
数据检测方法
脉搏
回归预测模型
样本
神经网络深度学习
互联网营销平台
风险预警管理
图谱
多源异构数据
节点
分布式光伏
注意力神经网络
地理位置信息
局部空间特征
门控循环单元