摘要
本公开的实施例公开了一种访问张量数据的方法、写入梯度数据的方法、电子设备与存储介质。该访问张量数据的方法包括:获取所述张量数据的起始元素所在的第一起始地址以及所述张量数据所在的内存块的第二起始地址;确定所述第一起始地址和所述第二起始地址存在偏移;将所述内存块中的数据加载至线程束中的至少一个线程对应的寄存器中;以及基于所述第一起始地址和所述第二起始地址之间的偏移量,对所述线程束中的至少一个线程对应的寄存器中存储的数据进行重排。本公开通过将非对齐访问转换为线程束内寄存器操作,能够减少非对齐访问导致的访存指令拆分和延迟,从而最大化人工智能芯片的访存带宽和并行计算能力。
技术关键词
数据存储
计算机可执行程序
内存
人工智能芯片
电子设备
处理器
元素
可读存储介质
指令
存储器