PFC是属于 数据链路层(L2) 的以太网控制机制。
L2:PFC(硬暂停)
L3:ECN(拥塞标记)
L4:DCQCN(降速算法)
PFC 控制链路
ECN 控制拥塞
DCQCN 控制速率
PFC(Priority Flow Control)是 IEEE 802.1Qbb 定义的
以太网二层流控机制,通过发送 L2 Pause Frame
控制对端暂停指定优先级流量,用于构建无损以太网。
PFC是谁暂停发送,是交换机和GPU网卡?
谁收到 PFC Pause Frame
谁就暂停发送
也就是说:
交换机收到 → 交换机暂停发送
GPU服务器网卡(NIC)收到 → NIC暂停发送
PFC本质是 接收端告诉对端:你先别发了,我要满了。
一、最常见的场景(AI / RoCE 网络)
交换机检测到队列拥塞
GPU NIC ─────→ ToR Switch
发送数据
交换机 buffer 快满:
ToR Switch
↓ 发送 PFC PauseGPU NIC
↓ 暂停发送 RoCE 流量
所以这里:
设备 行为
交换机 发送 PFC
GPU NIC 暂停发送
二、另一种情况(反向)
如果 GPU NIC 接收缓存满:
Switch ─────→ GPU NIC
GPU NIC 会发送:
GPU NIC
↓ PFC Pause FrameSwitch
↓ 暂停发送
所以:
设备 行为
GPU NIC 发送 PFC
交换机 暂停发送