一、国产AI芯片出货占比突破50%,算力替代进入新阶段

2025年第四季度,搭载国产芯片的AI服务器出货量,在国内市场占比首次突破50%。

这不是简单的“国产整机组装”,而是核心算力芯片的自主供给站上主流。

在高端GPU持续受限的大背景下,中国算力基建正在完成一场从单点突破到体系重构的质变。

比起大家热议的芯片替代,我更想讲一个决定未来格局的新趋势——

AI超节点,正在成为国产算力换道超车的主战场。

二、为什么必须做超节点?传统集群还有出路吗?

大模型进入万亿参数+MoE混合架构时代后,一个瓶颈彻底暴露:

算力够了,通信炸了。

传统的Scale-out横向扩展集群,本质就是传统PC集群(服务器集群)的主流模式,行业内也常将其称为PC农场(PC Farm),它是由多台标准化PC节点通过高速网络互联形成的分布式计算系统,核心原理是将复杂任务拆解为子任务,通过负载均衡算法分配至不同节点并行处理,像把分散的小车间用普通网线连起来,各算各的、协调低效。这类PC集群多采用机架式整合设计,单柜可承载数十个节点,支持分钟级热插拔扩容,具备高性价比、快速上线与模块化维护的特点,曾广泛应用于云游戏、大规模渲染、企业级虚拟化等通用算力场景,但在AI大模型训练中已力不从心。

而MoE架构依赖高频All-to-All全域通信,相当于要求所有模块实时同步、毫秒级协同,传统方案根本扛不住。

高并发、高带宽、低延迟,三大要求直接把传统集群逼到物理极限。

只有一条路:Scale-up架构的AI超节点

它不是服务器堆数量,而是把一整柜算力打成一个巨型统一系统,内存共享、高速直连、全域协同,完美适配大模型训练与推理的极致需求。需要明确的是,PC集群(PC Farm)与AI超节点并非对立关系,而是同属服务器集群技术谱系、适配不同场景的互补形态——PC集群侧重“多节点松散协同”,靠分布式架构实现弹性扩展,适合对成本敏感、需海量并发的通用场景;AI超节点侧重“单柜深度整合”,靠紧耦合架构突破通信瓶颈,专为千亿/万亿参数大模型训练设计,是PC集群在高端AI场景下的高阶演进形态。

三、超节点到底是什么?

- PC集群(PC Farm或PC农场,对应Scale-out架构):多设备松散组网,靠外部交换机通信,延迟高、带宽有限,采用分布式存储与智能运维体系,支持PB级数据统一管理,故障节点任务可快速自动迁移,适合云游戏、影视渲染、企业VDI等通用计算与轻量AI任务,核心优势是高性价比与灵活扩展。

- Scale-up:整机柜紧耦合,卡间直连、统一编址,带宽暴涨、延迟骤降。

超节点,就是把几十上百张AI芯片在一个机柜内深度整合,形成一体化的巨型算力单元。

英伟达GB200 NVL72是标杆,但国内早已买不到完整方案。

这也倒逼国内产业链,走出一条自主可控的超节点路线

四、国产超节点集体亮剑,规模化落地提速

从2025年下半年开始,国内头部厂商密集发布商用化超节点方案,行业正式从验证期走向落地期:

- 华为:CM384进入工程化交付,全栈自研体系成型

- 中科曙光:scaleX 640/40,支持大规模并行训练

- 百度:天池256/512,自研互联+昆仑芯深度协同

- 阿里:磐久128,面向云端推理与训练场景

- 浪潮信息:元脑SD200、CRS6000S,单机柜最高支持64张国产AI芯片

浪潮的方案最具代表性:

32卡Scale-up高速互联域,让卡间通信带宽直接提升8倍,千亿参数大模型训练从“按月算”压缩到“按周算”。

它还牵头组建超节点创新联合体,推出行业公认的“北京方案”,打通标准、互联、部署全链条。

据国金证券2026年4月行业研报显示,英伟达GB200 NVL72整机架已处于满负荷运行状态,国内阵营全面起势,海内外供给同步爆发,也印证了一个判断:

超节点,已是下一代智算中心的标配底座。

五、从服务器到整机柜,行业格局重塑

行业正在发生一个底层切换:

交付单元从单台服务器,升级为整机柜/Pod级一体化系统

这不是简单的形态变化,而是三重壁垒的重塑:

1、工程壁垒拉高:高密度液冷、高压供电、高速互联,三者缺一不可

2、供应商高度稀缺:能做全国产化超节点整机柜的厂商屈指可数

3、毛利率空间打开:交付复杂度提升,头部ODM具备更强议价能力,盈利结构向上迁移

典型案例就是华勤技术:

超节点业务2026年Q2启动发货,下半年大规模上量,全年相关收入指引突破百亿元。

单一业务线跑出百亿级规模,足以说明行业爆发力度。

六、布局逻辑:四大核心支撑,现在是最佳窗口

1、政策刚性驱动

算力自主可控上升为国家战略,各地智算中心优先采购全国产方案,需求确定性极强。

2、技术跨过临界点

国产AI芯片在训练、推理场景全面成熟,性能可对标国际主流,支撑超节点稳定运行。

3、成本优势显著

海外高端芯片渠道价高企,国产超节点在性价比、交付周期、服务响应上全面占优。

4、存量替换空间巨大

国内现有AI集群仍以传统Scale-out(即传统PC集群/PC Farm松散组网)为主,这类PC集群虽能通过节点扩展实现总算力提升,但受限于节点间通信开销,延迟相对较高,难以适配大模型高频All-to-All通信需求。

而全面升级为Scale-up超节点,不仅是AI算力的迭代,更带来传统PC集群基建的万亿级重构机会——尤其在云游戏、渲染农场等原有PC集群优势场景,超节点与PC集群的协同部署,可实现“通用算力+高端AI算力”的双重覆盖,兼顾成本与性能。

七、产业链机会

1、AI整机柜核心厂商:浪潮信息、华勤技术、中科曙光、紫光股份(国金证券研报重点标的,核心受益于整机柜交付浪潮)

2、高速互联交换芯片:盛科通信、锐捷网络(解决超节点All-to-All通信的核心瓶颈,支撑高密度互联需求)

3、高密度高速连接器:华丰科技(超节点高密度互联的核心部件,是整机柜高速通信的关键支撑)

4、国产算力核心芯片:寒武纪、海光信息(超节点算力底座,性能已接近国际主流水平)

风险提示:行业竞争加剧、技术研发不及预期、下游资本开支周期性波动,请注意投资风险(据国金证券研报提示,理性看待产业机遇)。

几年前,很多人质疑:没有高端GPU,中国AI还能走多远?

今天,答案已经写在超节点的机架上。

我们没有在单卡赛道硬拼,而是用系统级创新实现换道超车。

从能用,到好用;从跟随,到并跑;从被动受限,到主动定义标准。

国产AI超节点的爆发,不只是一款产品的胜利,而是中国算力产业链全面成熟的标志。浪潮奔涌而来,有人看见风险,有人看见时代。

#超节点#国产超节点 #AI算力 #国产AI芯片#PC集群 #PC农场

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐