摘要
本申请实施例提供基于PCIE的流量处理方法及Scale‑up网络架构。本实施例中,通过在原有Scale‑up网络架构上增加部署至少一个PCIE Switch系统,该Scale‑up网络架构原有的N个GPU通过PCIE链路连接至对应的PCIE Switch系统,该Scale‑up网络架构中原有的N个GPU还通过Scale‑up网络连接。基于此,可利用本第一GPU连接至PCIE Switch系统的第一PCIE链路将第一类数据发送至第二GPU,这样能够有效避免如KV缓存流量这类数据对于原有Scale‑up网络链路的带宽占用,从而降低对如TP流量和EP流量等这类数据的传输延迟和稳定性的影响。
技术关键词
网络架构
链路负载分担
数据
计算机扩展总线
GPU并行
图形处理器
内存