在智算中心 RoCE 网络技术体系中,INT(In-band Network Telemetry,带内网络遥测)技术是一种核心的网络状态感知技术,其核心价值是突破传统 “端到端” 间接监控的局限,通过在数据报文内部嵌入网络设备的实时状态信息,实现对网络传输路径性能瓶颈的精准细粒度监测,为拥塞控制、流量适配等策略提供数据支撑。


一、INT 技术的核心原理

INT 技术的本质是 “数据报文与遥测数据融合传输”,无需依赖独立的监控链路,其工作流程可分为三步:

  1. 遥测指令注入:网络入口设备(如边缘交换机或智能网卡)在转发用户数据报文时,根据预设规则(如采样频率、监控维度),在报文头部或预留字段中嵌入 INT 遥测指令(包含需采集的指标类型,如队列长度、带宽利用率、转发延迟等)。
  2. 路径节点数据采集:报文在传输路径中经过的每台网络设备(如交换机、路由器),都会根据 INT 指令自动采集自身的实时状态数据(如该设备的端口队列长度、报文转发延迟、带宽占用率),并将这些数据追加到报文的 INT 字段中,不影响用户数据的正常传输。
  3. 数据汇总与分析:报文到达目标端(如接收端服务器)后,接收设备提取报文中的 INT 遥测数据,汇总形成完整的 “端到端传输路径状态报告”,可实时分析路径中的瓶颈节点(如某台交换机队列拥堵)、传输延迟分布等问题。


二、INT 技术的核心监控能力

INT 技术可提供细粒度、多维度的网络状态数据,覆盖智算中心 RoCE 网络传输的关键需求,主要包括:

  • 链路层指标:链路带宽利用率、端口转发速率、报文丢包率(某段链路的丢包位置定位);
  • 设备队列指标:交换机 / 网卡的端口队列长度、队列缓存占用率(直接反映拥塞风险);
  • 传输延迟指标:报文在每台设备的转发延迟、端到端总延迟(精准定位延迟来源);
  • 流量特征指标:单流 / 多流的带宽占用占比、流量突发频率(支撑流量类型识别)。


三、INT 技术与传统监控技术的对比优势

相比传统网络监控技术(如 SNMP 简单网络管理协议、端到端 RTT 探测),INT 技术的核心优势体现在 “精准性、实时性、低开销” 三点,具体对比如下:

技术类型 监控粒度 延迟感知精度 带宽开销 拥塞定位能力
SNMP(传统) 设备级(整台交换机) 秒级 5%-8% 仅能定位 “某台设备”,无法定位具体链路 / 队列
端到端 RTT 探测 端到端(无中间节点) 毫秒级 2%-3% 仅知总延迟,无法定位延迟 / 丢包节点
INT 技术 报文级(每台设备 / 每段链路) 微秒级 <1%(PINT 优化) 精准定位 “某台设备的某端口队列” 拥塞 / 丢包

四、概率性 INT 技术

概率性 INT 技术(Probabilistic In - band Network Telemetry,简称 PINT)是对传统 INT 技术的轻量化优化方案,核心是通过概率采样分布式协作的方式,在保障网络状态监控精度基本不受影响的前提下,大幅降低遥测带来的网络带宽开销,解决传统 INT 每包都嵌入遥测数据导致的负载过高问题。

1.核心定义

该技术打破了传统 INT 中数据包需承载路径上所有交换机遥测数据的模式,仅让数据流中的部分数据包按概率携带网络设备的状态信息(如交换机端口利用率、队列占用率等),且数据包的有效负载率不会随传输路径长度增加而下降。同时它支持一条数据流承载多个测量任务,能满足多维度的网络监控需求,适配智算中心、云计算等对传输效率和监控精度均有要求的场景。

2.实现方式

其实现依赖哈希计算、分布式协作采样、数据汇总分析等关键操作,具体流程可分为以下几步:

  1. 预设配置与任务定义:首先管理员预先定义遥测相关参数,比如设定遥测摘要的固定长度,明确每个测量任务的内容,像收集交换机 ID、端口利用率等,同时为不同测量任务分配对应的执行概率,重要任务可设置更高执行概率,还会建立测量任务与标识信息的对应关系,方便后续节点识别任务类型。
  2. 首端交换机的概率筛选:当数据包到达路径上的首端交换机(PINT source)时,交换机会通过哈希函数 h 计算出一个 0 - 1 区间内的哈希值。结合预设的各测量任务执行概率,依据该哈希值判定当前数据包是否执行遥测任务以及具体执行哪项任务。若判定执行任务,首端交换机就会为数据包添加预设长度的遥测摘要,填入自身的遥测数据和对应的任务标识信息。
  3. 中间节点的分布式协作写入:路径上的中间交换机采用全局哈希技术与储层采样算法配合实现协作。中间交换机会通过哈希函数 g,结合数据包信息和自身所处的路径跳数计算出 0 - 1 区间的哈希值。若该哈希值小于等于 1 与当前跳数的比值,就用自身的遥测数据覆盖数据包中原有遥测数据;反之则不进行操作。这种设计能保证每个数据包等概率地携带路径上任意一个交换机的信息,实现分布式的遥测数据采集。
  4. 末端节点的数据提取与汇总:当数据包到达末端交换机(PINT sink)时,该交换机会提取数据包中的遥测数据和任务标识,并将这些数据发送至后端的记录与分析模块。分析模块会对来自同一条数据流多个数据包的零散遥测数据进行整合,结合概率统计方法,还原出完整的网络路径状态,比如各交换机的运行状态、链路拥塞情况等,最终完成网络状态的全面感知。


五、总结

INT 技术是智算中心 RoCE 网络从 “被动拥塞处理” 转向 “主动流量适配” 的关键支撑,其与 RNL 多维感知、AI 场景识别的结合,可实现 “状态精准感知 - 场景智能判定 - 策略动态调整” 的闭环,最终解决多场景流量动态切换的适配难题。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐