一、PCIe 的核心定位

PCIe(Peripheral Component Interconnect Express)是 GPU 服务器中连接GPU 与 CPU、系统内存及其他核心部件的 “高速公路”。它的带宽、延迟和拓扑结构直接决定了 GPU 能否高效工作。


二、PCIe 在 GPU 服务器中的关键作用(按重要性排序)

1、 数据通道:GPU 与系统间的高速传输

这是 PCIe 最核心、最基础的功能。

  • 数据输入:训练数据、模型参数需从系统内存(或 NVMe SSD)经 PCIe 传输至 GPU 显存(HBM)
  • 数据输出:计算结果需从 GPU 显存经 PCIe 传回系统内存
  • 瓶颈风险:带宽不足(如使用 PCIe 3.0 x16 而非 4.0/5.0 x16)会导致 GPU 等待数据,利用率下降

2、 控制通道:CPU 对 GPU 的指令下达

CPU 作为 "大脑",通过 PCIe 向 GPU 发送任务和配置。

  • 指令类型:计算任务、配置参数、同步信号等
  • 延迟敏感:虽然数据量小,但高频小任务会放大 PCIe 延迟影响

3、 扩展能力与拓扑结构决定

PCIe 通道数和版本直接影响服务器可搭载的 GPU 数量及连接方式。

  • 通道限制:单 CPU 通常提供 64 条通道,一条 x16 插槽占用 16 条
  • 理想连接:每个 GPU 直连 CPU,享受最大带宽和最低延迟
  • 实际限制:多 GPU 配置常需通过 PCIe 交换机共享链路,导致性能差异

4、GPU 间通信基础

在 NVLink 普及前,多 GPU 通信完全依赖 PCIe。

  • PCIe P2P:支持 GPU 直接访问另一 GPU 显存,无需 CPU 中转
  • 当前地位:即使有 NVLink,跨 CPU 节点的 GPU 通信仍依赖 PCIe

总结:PCIe 在 GPU 服务器中的作用是基础性的和可能成为瓶颈的:

  • 它是数据输入的 “生命线”
  • 它是 CPU 控制 GPU 的 “指令通道”
  • 它决定了服务器的 GPU 扩展能力和布局
  • 它是 GPU 间通信的基础方案(在无 NVLink 或跨节点时)

因此,在选择或配置 GPU 服务器时,PCIe 的版本(3.0/4.0/5.0)、每个 GPU 分配的通道数(x8/x16)、以及 PCIe 的拓扑结构(如何连接到 CPU)都是需要重点关注的核心指标,它们直接影响了整个系统的投资效率和最终性能。


三、PCIe vs NVLink:高速公路 vs 高铁

特性 PCIe(高速公路) NVLink(高铁)
设计目标 连接 CPU 与各类外设 GPU 到 GPU 高速互联
带宽 较低 (PCIe 5.0 x16≈128GB/s) 极高 (NVLink 4.0≈900GB/s)
拓扑 树形结构 网状结构,延迟更低
角色 "对外公路" "内部高铁"

协作关系:在现代服务器中,PCIe 和 NVLink 是共存的。NVLink 负责在多个 GPU 之间建立超高速数据通道,极大加速模型训练(All-Reduce 等集合通信操作)和推理。PCIe 仍然负责 GPU 与 CPU / 内存 / 网络 / 存储之间的数据交换和控制流。如果 NVLink 是连接各个计算单元(GPU)的城际高速铁路,那么 PCIe 就是连接计算单元与中心城市(CPU)、货运站(内存)和港口(网络 / 存储)的必不可少的高速公路网。


四、PCIe 物理规格

1、通道数(Lane Width)

  • x1:低速设备(网卡、声卡等)
  • x4:中等带宽设备(部分 SSD、网卡)
  • x8:高性能设备(企业级 SSD、高速网卡、中端 GPU)
  • x16:GPU 常用,提供最大带宽

说明:主板上为什么找不到 PCIe x4 插槽?其实它以 M.2 接口的形式出现。与 PCIe x8 插槽一样,PCIe x4 为了兼容性,多数情况下也被做成 PCIe x16 插槽形式,或扩展为 M.2 接口,用于安装 M.2 SSD、M.2 无线网卡或其他 M.2 接口设备,其余扩展卡则留给 PCIe x1 插槽负责。

关键点

  • 物理兼容:大卡可插小槽,但性能受限于电气通道数
  • M.2 接口:常采用 PCIe x4 通道

2、尺寸分类

  • 全高 / 全长 (Full-Height, Full-Length,Standard GPU):传统标准,尺寸较大,常见于台式机和服务器 GPU。
  • 半高 (Half-Height,Compact GPU):高度减半,用于刀片服务器或小型化工作站。
  • 矮版 (Low-Profile):更短的版本,用于超小型 PC。

3、PCIe 延长线

PCIe 延长线(PCIe Riser Cable)是一种用于延长 PCIe 设备(如 GPU、固态硬盘等)与主板插槽之间连接距离的线缆。它通常由高质量的电缆和两端的连接器组成,一端连接主板的 PCIe 插槽,另一端连接 PCIe 设备。

适用场景

  • 改善散热与风道
  • 特殊机箱布局
  • 硬件展示与美观
  • 多显卡扩展与特殊应用

注意事项

  • 兼容性匹配:确保延长线支持的 PCIe 版本与主板插槽和设备兼容
  • 长度控制:不宜过长,避免信号衰减和性能风险

五、PCIe 版本演进

版本 发布 速率 编码 单通道带宽 x16 带宽
1.0 2003 2.5 GT/s 8b/10b 500 MB/s 8 GB/s
2.0 2007 5.0 GT/s 8b/10b 1 GB/s 16 GB/s
3.0 2010 8.0 GT/s 128b/130b ~1.97 GB/s ~31.5 GB/s
4.0 2017 16.0 GT/s 128b/130b ~3.94 GB/s ~63 GB/s
5.0 2019 32.0 GT/s 128b/130b ~7.88 GB/s ~126 GB/s
6.0 2022 64.0 GT/s PAM4+FEC ~15.75 GB/s ~252 GB/s

未来展望

  • PCIe 7.0:速率提升至 128 GT/s(128 Gbps / 每通道),比 PCIe 6.0 再翻倍,或将支持光互连,而不仅限于铜线。主要面向超大规模数据中心(如 800G 以太网)、高性能计算、军工航天与汽车应用,预计 2028 年推出产品(标准发布后 12–18 个月)。由于成本高,可能不会很快进入 PC 级市场。
  • PCIe 8.0:研发已启动,预计再次翻倍 PCIe 7.0 速率,可能仍基于 PAM4 + Flit,但铜线或无法支撑,需采用光互连,或引入 PAM8(每信号 3 比特),这要求更强的信噪比检测与纠错能力。

技术要点

  • 向后兼容:高版本卡可在低版本插槽运行,但会以低版本速度运行。
  • 编码效率:从 20% 开销降至 1.5%
    • 8b/10b (PCIe 1.0/2.0):每 10 位传输信号中只有 8 位是有效数据,开销为 20%。
    • 128b/130b (PCIe 3.0/4.0/5.0):每 130 位传输信号中有 128 位是有效数据,开销仅为~1.5%,显著提升了有效带宽。
    • PAM4 & FEC (PCIe 6.0):采用更先进的脉冲幅度调制和前向纠错,在高速下保证信号完整性
  • GT/s 与 GB/s 区别:需考虑编码效率和双向传输
    • GT/s (Giga Transfers per second):表示原始数据传输速率。
    • GB/s (GigaBytes per second):表示有效数据带宽,需要经过编码开销和双向计算。
    • 换算公式:带宽 (GB/s) = (速率 (GT/s) × 编码效率 × 通道数 × 2 [双向]) / 8 (字节位转换)

六、带宽计算(路宽 × 车速)

物理规格是 “路宽”(x1、x4、x8、x16 是车道数),而版本是 “路速”(3.0、4.0、5.0 是限速标准)。最终的 “运输能力”(带宽)由 “路宽” 和 “路速” 共同决定。为 GPU 选择正确的 “路宽” 和 “路速” 至关重要。

计算公式:总带宽 = 版本速率 × 编码效率 × 通道数 × 2 (双向) ÷ 8 (字节位转换)

举例:一张 PCIe 4.0 x16 的 GPU,其理论最大带宽为:

  • 速率:16.0 GT/s
  • 编码效率:128/130 ≈ 0.9846
  • 通道数:16
  • 双向:2

计算过程:(16.0 GT/s × 0.9846 × 16 × 2) ÷ 8 ≈ 63 GB/s


七、对 GPU 服务器的实际意义

1)避免瓶颈:必须为高性能 GPU 配备足够高版本和足够多通道的 PCIe 插槽。将一块 PCIe 5.0 的 GPU 插入 PCIe 3.0 x16 的插槽,其可用带宽将从~126 GB/s 暴跌至~31.5 GB/s,成为严重的性能瓶颈。

2)选择主板 / 平台:选择服务器主板时,必须关注:

  • CPU 支持的 PCIe 版本和通道总数(如 Intel 至强可扩展处理器通常提供 64 条 PCIe 通道)
  • 主板 PCIe 插槽的电气通道分配(是 x16 还是 x8?是直接连接 CPU 还是通过芯片组?)

3)面向人工智能市场需求:PCIe 5.0 和 6.0 主要面向 GPU、高速网卡(400GbE+),以及 CXL(Compute Express Link)内存扩展技术,是构建下一代高性能计算和 AI 服务器的基石。


八、总结

PCIe 在 GPU 服务器中是数据生命线、控制通道、扩展基础和通信桥梁。选择 GPU 服务器时,必须关注:

  • PCIe 版本(车速)
  • 通道数分配(路宽)
  • 拓扑结构(路网规划)

这些因素直接决定了 GPU 性能能否充分发挥,影响整个系统的投资效率和最终产出。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐