在这里插入图片描述
在这里插入图片描述


AI时代的数据中心网络互联给光模块提出新的挑战,传输距离、运维效率、互联安全等光模块属性亟待提高,为此华为公司创建了星联光模块品牌。同时,为应对AI算力的蓬勃发展,华为还推出了可独立销售的星联光模块产品,适配多种类型的算力网卡和交换机。华为星联光模块通过严格质量把控,端到端研发和制造,打造高品质互联,支撑业务长期发展。


什么是星联光模块

2025年3月在世界移动通信论坛(Mobile World Congress,MWC)大会上,华为面向全球正式发布星联光模块(StarLink Optical Module)。华为推出的一系列星联光模块产品,旨在打造3S(Spanning-超远传输、Stable-超高可靠、Secure-超高安全)高品质网络体验,加速企业数智化进程。

为什么需要星联光模块

随着人工智能的高速发展,AI训练集群正从“千卡时代”迈向“万卡时代”。在这一过程中,网络互联对系统整体算力发挥着至关重要的作用,而光模块数量的急剧增长,也带来了前所未有的可靠性与维护挑战。

以大型模型训练为例:

  • 训练GPT-3规模的千卡集群,约需2500个200G光模块或4000个400G光模块;
  • 到GPT-4万卡集群阶段,则需要25000个200G光模块或40000个400G光模块进行高速互联。

平均来看,每增加一张GPU卡,就需要2.5~4个光模块来支撑网络通信。如此庞大的模块数量,使得网络系统的稳定性成为制约算力发挥的关键因素。

然而,实际运行中光模块的故障率并不低。以行业平均年失效率4‰计算,万卡级集群在训练过程中,平均每3.6天就可能因光模块故障导致中断一次,每次平均恢复需约2小时,仅算力浪费一项,便可能造成每天140万元的经济损失。因此,为应对万卡时代的网络稳定性与运维挑战,提升训练效率并降低故障损失,引入更高可靠、更高性能的星联光模块成为必然选择。

星联光模块的关键技术

星联光模块面向数据中心和 AI 网络互联场景,具备三大核心优势:

  1. 超远传输:华为光路耦合算法,通过深度光学设计,控制优化光信号功率分布,保证最强光强传输,提升传输距离,避免机房布线改造,大幅降低互联成本。
  2. 超高可靠:华为短距光回损定位技术,利用光链路中脏污会遮挡光线,导致光线反射形成回损,将回损信号和正常信号的强度和时延对比推断脏污、松动位置和程度。精准识别脏污松动故障点,可将光模块整体可靠性提升一个数量级,显著降低故障率。
  3. 超高安全:华为PHYSec物理层加密技术,在光模块oDSP(光数字信号处理器)侧实现100%报文加密,释放设备上层处理压力,确保用户数据隐私更安全。该技术具备低时延、零带宽损耗与灵活部署等优势,为数据中心提供全链路硬件级加密防护,实现更高等级的网络安全保障。

星联光模块的应用场景

华为星联光模块主要应用于新一代数据中心和智能算力网络,适用于人工智能训练集群、高性能计算(HPC)、金融云以及大型企业数据中心等高速互联场景。其设计重点在于提升网络可靠性、传输距离与数据安全性,以满足大规模算力集群对高带宽、低时延互联的需求。

例如,在NVD场景中,星联光模块可用于Spine-Leaf架构的网络互联。以XH9230 51.2T交换机为例,Spine与Leaf间可选用多种400G QSFP112模块,包括FR4、DR4、SR4、VR4等型号,以适配不同的链路距离与传输模式;Leaf与服务器之间则支持400G OSFP-RHS与200G QSFP112等多种速率组合,可分别匹配CX7、BF3等主流网络接口卡,实现不同类型服务器的高速互连。该方案能够支持大规模GPU集群部署,保障集群内部算力高效分布与通信性能。

在某金融企业项目的实践中,华为星联光模块展现了卓越的性能优势。该项目在数字化转型中,数据中心由40G演进至 100G网络,跨机房部署超过1000台机架,对互联距离和信号质量提出了更高要求。华为为其提供了100G QSFP-BIDI多模光模块方案,可在不更改机房布线结构的前提下实现150米高可靠传输,满足跨机房Spine-Leaf网络互联需求。与传统单模DR模块相比,该方案不仅显著降低了布线与部署成本,还同时保证信号传输稳定性。

在这里插入图片描述
华为星联光模块应用场景

FAQ

什么是独立销售光模块

华为星联光模块除随整机设备交付外,也支持独立销售模式,以满足AI数据中心、云数据中心等多样化网络部署需求。客户可灵活选择与现有网络设备兼容的光模块,加速资源扩展与升级节奏,并提升运维与库存管理效率。

独立销售星联光模块严格遵循业界标准,兼容主流接口与协议,并通过多厂商测试验证,可满足主流交换机厂商与AI集群的部署要求。

服务器接入与交换机互联应该如何选择光模块

在数据中心典型场景中,服务器与接入交换机之间的光模块选择取决于服务器网卡的接口带宽大小,接入交换机与汇聚交换机之间的互联光模块的接口选择由交换机支持的接口带宽以及实际业务流量模型来决定。

VR、SR、DR、FR光模块的主要规格区别和适配场景是什么

VR、SR、DR、FR光模块的区别主要体现在传输距离、光纤类型及应用场景等方面。详细介绍如下:

  • VR:极短距离模块,通常用于设备内部或短距离连接。
    传输距离:通常为50m。

光纤类型:多模光纤(MMF)。

应用场景:数据中心内部设备互联。

  • SR:短距离模块,常见于局域网和数据中心。
    传输距离:通常为100m。

光纤类型:多模光纤(MMF)。

应用场景:数据中心内部、交换机互联等短距离高速传输。

  • DR:DR光模块是一种专为数据中心和高速通信场景设计的光模块,其核心特点在于短距离高带宽传输能力;采用并纤技术,将多个光信号通过物理方式合并到同一根光纤中传输。
    传输距离:通常为500m。

光纤类型:单模光纤(SMF)。

应用场景:

  1. 数据中心互联:广泛用于服务器与交换机之间的高速互联,尤其适合GPU集群、AI训练集群等大规模并行计算场景;
  2. 短距离骨干网:在城域网或企业核心网络中,作为短距离高带宽链路的解决方案,替代传统铜缆或长距光模块;
  3. 边缘计算节点:为边缘数据中心提供紧凑型高带宽接入,满足5G基站回传、物联网(IoT)数据汇聚等需求。
  • FR:是一种专为长距离、高稳定性的点对点光传输设计的光模块,通常工作在单波长,主要采用单模光纤(SMF)进行数据传输;采用合波技术,通过简单的光耦合器或分束器来实现信号的合并和分离,将多个不同波长的光信号合并到同一根光缆的不同光纤。
    传输距离:一般为2km。

光纤类型:单模光纤(SMF)。

应用场景:

  1. 数据中心互联(DCI):在跨数据中心的高带宽、低延迟需求场景中,实现高效数据交换;
  2. 企业专线:为大型企业提供高可靠、低延迟的专用网络连接。

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐