基于PCIE的流量处理方法及Scale-up网络架构

AITNT
正文
推荐专利
基于PCIE的流量处理方法及Scale-up网络架构
申请号:CN202511305132
申请日期:2025-09-11
公开号:CN120811988B
公开日期:2025-11-14
类型:发明专利
摘要
本申请实施例提供基于PCIE的流量处理方法及Scale‑up网络架构。本实施例中,通过在原有Scale‑up网络架构上增加部署至少一个PCIE Switch系统,该Scale‑up网络架构原有的N个GPU通过PCIE链路连接至对应的PCIE Switch系统,该Scale‑up网络架构中原有的N个GPU还通过Scale‑up网络连接。基于此,可利用本第一GPU连接至PCIE Switch系统的第一PCIE链路将第一类数据发送至第二GPU,这样能够有效避免如KV缓存流量这类数据对于原有Scale‑up网络链路的带宽占用,从而降低对如TP流量和EP流量等这类数据的传输延迟和稳定性的影响。
技术关键词
网络架构 链路负载分担 数据 计算机扩展总线 GPU并行 图形处理器 内存
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号