大算力芯片计算架构的K维度张量切分方法、装置、设备、介质和产品

AITNT
正文
推荐专利
大算力芯片计算架构的K维度张量切分方法、装置、设备、介质和产品
申请号:CN202510965065
申请日期:2025-07-14
公开号:CN120950786A
公开日期:2025-11-14
类型:发明专利
摘要
本申请涉及一种大算力芯片计算架构的K维度张量切分方法、装置、设备、介质和产品。所述方法包括:在Transformer网络的训练过程中,将Transformer网络中的输入矩阵的转置矩阵按照列维度拆分为N个列输入转置向量;将Transformer网络中的输出矩阵按照列维度和行维度拆分成N2个第三输出元素;在N个不同计算设备中每个计算设备上,部署一组对应的列输入转置向量和输出矩阵中的N个第三输出元素;输出矩阵中包括N2个第三输出元素;基于集合通信的方式,经过N轮计算得到N个第三输出元素分别与各列输入转置向量之间的乘积和;整合每个计算设备上的乘积和,以得到权重梯度矩阵。采用本方法能够有效地减小Transformer网络训练的张量存储与通信开销。
技术关键词
元素 矩阵 网络 切分装置 计算机程序产品 处理器 芯片 计算机设备 模块 可读存储介质 存储器
系统为您推荐了相关专利信息
1
一种面向透视畸变图像的单目穿衣人体重建方法
多视角特征融合 相机内部参数 图像块 人体拓扑结构 采样点
2
一种基于模型预测控制的自动驾驶车辆轨迹跟踪方法
车辆轨迹跟踪方法 前轮 北斗差分定位 误差模型 坐标系
3
基于三细胞神经网络的柔性脉搏数据检测方法及系统
数据检测方法 脉搏 回归预测模型 样本 神经网络深度学习
4
一种互联网营销平台风险预警管理方法及系统
互联网营销平台 风险预警管理 图谱 多源异构数据 节点
5
一种基于双域自适应图神经网络的分布式光伏出力预测方法及系统
分布式光伏 注意力神经网络 地理位置信息 局部空间特征 门控循环单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号