摘要
本申请公开一种CPU蝶形网络计算方法,涉及网络计算领域,方法包括,蝶形网络优化的步骤、蝶形算法优化的步骤和SIMD优化的步骤;蝶形网络优化的步骤包括,基于迭代的Stockham FFT计算框架,以Cooley‑Tukey FFT算法对计算内核合并,用于提升蝶形网络性能;蝶形算法优化的步骤包括,提取蝶形计算式的公共项,将大基蝶形计算化简,用于蝶形算法优化;SIMD优化的步骤包括,优化SIMD汇编指令,设计寄存器复用策略和堆栈内存使用方式,利用存储器缓解大基蝶形计算的访存压力。通过上述方案,筛选延迟低且吞吐量高的指令,加速指令处理速度,通过寄存器复用,提升运算资源处理数据的效率。
技术关键词
蝶形网络
计算方法
浮点寄存器
因子
算法
指令
单精度浮点数
序列
数据存储
内核
内存
周期性
策略
框架
存储器
复杂度
阶段
平台