摘要
本发明涉及人工智能芯片技术领域,提供一种任务处理方法、装置、设备、存储介质及程序产品,该方法应用于人工智能芯片的可编程多处理器,包括:将待执行任务切分为多个任务片;N个可编程多处理器并行处理所述任务片;可编程多处理器对任务片的处理包括:计算各任务片对应的待读取数据的数据地址,并基于其中的远端地址向远端芯片发送片上高速缓存预取指令,以读取对应的远端数据;根据读取的远端数据执行任务片对应的子任务,得到待执行任务的处理结果。通过片上高速缓存预取指令进行卡间通信,并基于多个可编程多处理器对切分后的任务片的异步并发执行,提高了卡间通信的带宽性能,可避免因未处理请求的数量不足导致的带宽性能瓶颈。
技术关键词
多处理器
高带宽
人工智能芯片技术
非暂态计算机可读存储介质
数据存储
指令
数据读取模块
内存
计算机程序产品
存储器
电子设备
瓶颈