摘要
本申请涉及一种多核DSP上的模板计算优化方法、装置及设备。所述方法包括:将输入的数据网格划分为若干个数据块,并为每一个数据块分配一个DSP核。在当前时间步,全部DSP核均完成对已分配的数据块进行一级计算,将数据块进一步划分为多个子块,子块包含多个相邻的网格点。在下一时间步,将子块加载至DSP的向量片上存储器,并利用DSP的向量计算单元对子块进行二级计算,得到每个网格点的新值。将计算得到的新值打包成新子块存储回向量片上存储器,新子块采用三缓冲机制通过DSP的数据移动单元从向量片上存储器传输至片外存储器进行加载与存储。采用本方法能够提高多核DSP的计算性能。
技术关键词
向量处理单元
存储器
网格
数据
缓冲
多核DSP芯片
移动单元
阶段
指令流水线技术
模板
浮点乘加运算
机制
依赖形状
重用策略
模式
搬运模块
优化装置
计算机设备
内存