让 AI 跑得更快的发动机:Micron 9650 PCIe Gen6 SSD 深度解析

标图:Micron 9650 提供 E1.S (9.5mm/15mm) 与 E3.S 两种形态,支持风冷与液冷题

一、背景:AI 数据中心的“数据瓶颈”

在当今的 AI 训练与推理集群中,GPU 并不是唯一的性能核心。研究表明,AI 工作负载中 GPU 的峰值性能往往只能发挥 不到 50%,原因就是 数据供应不足:GPU 等待数据的时间过长,导致算力浪费。

Micron 9650 SSD 的出现,就是为了解决这个数据供应瓶颈。作为全球首款 PCIe Gen6 数据中心级 SSD,它不仅刷新了性能纪录,更将存储的能效和可持续性提升到了新的高度。


二、性能突破:28 GB/s + 5.5M IOPS

Micron 9650 被称为“全球最快的数据中心 SSD”,数据参数足以证明:

性能指标

Micron 9550 (Gen5)

Micron 9650 (Gen6)

提升幅度

顺序读取

14 GB/s

28 GB/s 100%

顺序写入

10 GB/s

14 GB/s 40%

随机读取

3.3M IOPS

5.5M IOPS 61%

随机写入

720K IOPS

900K IOPS 22%

亮点解读

  • 28 GB/s 顺序读取,意味着一秒可以传输约 7 部高清蓝光电影

  • 5.5M IOPS 随机读取,使其在数据库、AI 训练数据加载时能大幅减少等待。


直观理解:如果把 GPU 比作赛车引擎,那么 SSD 就是“燃料供应管路”。9650 SSD 相当于把管路直径翻了一倍,保证引擎不再因缺油而停摆。


三、能效与可持续性:绿色算力的关键

数据中心正在消耗全球 1–2% 的电力,到 2030 年可能会增加 160%。但存储容量年增长率达 24%,电力预算却只能增长 7.5%。

Micron 9650 的设计紧贴这一矛盾:

指标

Gen5 SSD

Micron 9650 (Gen6)

提升幅度

顺序 IO 效率 (MB/s/W)

560

1120 2X

随机读效率 (KIOPS/W)

132

220 1.7X

随机写效率 (KIOPS/W)

28.8

36 1.2X

此外,Micron 9650 还在 E1.S (9.5mm) 外形中提供 液冷优化版本,这意味着它可以直接接入主流液冷解决方案,让机柜更高密度、更节能。

标图:液冷是未来高密度 AI 训练集群的趋势,9650 已预留接口支持题

四、Micron 创新:G9 NAND + 全栈垂直整合

9650 的另一大优势是 “全栈自研”

  • Micron G9 TLC NAND:业内首款第九代 NAND,采用 六平面架构,并行度更高,每颗 NAND 可支持 3.6 GB/s I/O,是目前最快的 NAND 闪存。

  • 控制器 & 固件:完全由 Micron 自研,确保和 NAND、DRAM 的最佳协同。

  • 验证 & 生态合作:与 Broadcom、Astera Labs 等 PCIe Gen6 生态伙伴共同测试互操作性,加速了整个产业的成熟。

这种“从 NAND 到控制器到固件”的全栈式整合,减少了第三方依赖,确保了性能一致性和验证效率。


五、规格亮点一览

  • 接口:PCIe Gen6 x4,NVMe 2.0

  • 外形规格:E1.S (9.5mm/15mm),E3.S (1T)

  • 容量:6.4TB ~ 30.72TB (MAX 系列),7.68TB ~ 30.72TB (PRO 系列)

  • 延迟:典型 60 µs 读,15 µs 写

  • 耐久性:最高 282PB 写入寿命 (30.72TB MAX 型号,顺序写)

  • 可靠性:MTTF 200–250 万小时,UBER < 1e-17

  • 安全性:支持 SPDM 1.2、SED、自加密、FIPS 140-3 Level 2


六、应用场景

  1. AI 训练与推理集群

    • 高速加载训练数据集

    • 大模型推理时快速交换参数与权重

  2. 高性能数据库

    • 极端 OLTP/OLAP 事务吞吐

    • 实时数据分析与金融计算

  3. 云与超大规模数据中心

    • 更高机架密度

    • 液冷环境适配

  4. 可持续计算基础设施

    • 降低 PUE(电源使用效率)

    • 支撑企业 ESG 战略


七、总结:存储进入 Gen6 时代

Micron 9650 不只是一个速度快的 SSD,它代表了数据中心存储的三个未来趋势:

  • 更快 —— 28 GB/s + 5.5M IOPS,让 GPU 真正满负荷运转。

  • 更绿 —— 2 倍能效提升,液冷适配,为绿色 AI 奠基。

  • 更稳 —— 全栈自研 + G9 NAND,保证可靠性与兼容性。

在 AI 驱动的数据中心新时代,Micron 9650 就像是“数据高速公路”的 8 车道扩展,让算力引擎不再受堵。

Micron 9650 PCIe Gen6 SSD:AI存储的新旗舰

Micron 9650 SSD 是业界首款PCIe Gen6 NVMe数据中心固态硬盘,专为AI训练与推理等超高负载场景设计。该驱动采用Micron自研控制器和第九代3D NAND(每片NAND单独I/O速率3.6GB/s、六平面架构),实现高达28 GB/s的顺序读性能和5.5 M IOPS的随机读性能,较上一代Gen5 SSD(如9550或Samsung PM1743)翻倍提升。同时,9650在同等25 W功耗下的能效优势明显,其随机写入/读取能效比分别提高了约25%和67%,意味着每瓦功耗下可处理更多数据。Micron 9650提供 1 DWPD(PRO)和3 DWPD(MAX) 两种耐用度级别,满足不同应用需求;相比之下,Solidigm P5430等QLC SSD耐久度仅约0.058 DWPD。9650还支持E1.S/E3.S多种封装,并提供液冷版本(9.5mm E1.S)以适应高密度AI服务器散热要求。

与主流SSD对比

  • 接口与带宽:9650采用PCIe 6.0×4接口(64GT/s),带宽是Gen5 ×4(32GT/s)的两倍。例如,Micron 9550和Samsung PM1743等Gen5 SSD顺序读写峰值约为14 GB/s,而9650达28 GB/s;Solidigm P5430(Gen4 QLC)仅6.4 GB/s。

  • 性能指标:凭借双倍的接口带宽和新一代控制器,9650顺序读写及随机IOPS指标显著领先前代。它的随机读IOPS高达5.5M,随机写0.9M,可轻松应对并发AI数据流;而上一代Gen5 SSD通常在百万级左右,负载一致时吞吐量受限。

  • 能效表现:在25 W功耗限制下,9650单位能耗能完成更多I/O。Micron官方数据显示,其随机写入/读取的每瓦IOPS比分别提高约25%和67%,意味着AI推理等I/O密集型场景下系统整体能耗更低、更高效。对比之下,Gen5 SSD性能虽然也强,但在相同功耗下提升空间有限。

  • 耐用性:9650推出1 DWPD(PRO)和3 DWPD(MAX)两种版本,适用于不同耐久需求;Solidigm P5430等高密度QLC SSD耐久度则远低,仅约0.058 DWPD,远逊于9650。Samsung PM1743等企业级Gen5 SSD多为TLC,通常也在1–3 DWPD级别,可见9650在企业级耐久性上与竞品相当甚至更优。

实际部署与生态验证

Micron 9650目前处于样品/预发布阶段,多家产业伙伴已在实测平台上采用并验证其性能。Astera Labs在FMS 2025会议上演示了 四块Micron 9650 SSD并联 下的AI平台测试,使用两台Scorpio PCIe 6.0交换机直连GPU,整体顺序读速超过 100 GB/s(相当于单机带宽将Gen5参数翻倍),证实了其在多SSD环境中可达到的性能天花板。此前在Computex 2025,Astera Labs也利用9650原型驱动其PCIe 6.0交换机进行实验。这些演示均表明,通过PCIe 6.0交换机和Retimer,GPU与SSD之间可以直接点对点传输数据,不依赖CPU中转,对AI模型训练而言意义重大:高性能存储可持续不断地喂饱GPU,消除存储I/O瓶颈,从而显著缩短训练时间、加快模型迭代

多家行业巨头也对9650展开技术合作和互操作测试。Broadcom与Micron合作,在PCI-SIG开发者大会上完成了PCIe 6.0生态系统的互联测试,Micron提供其高性能SSD,Broadcom提供高端交换机和Retimer,共同验证了Gen6网络和存储的兼容性。Dell及NVIDIA等用户也对9650寄予厚望:Dell基础架构负责人指出,9650的5.5M IOPS随机读性能令GPU保持持续数据供给,从而避免空闲;NVIDIA高层则强调PCIe 6.0 SSD可为复杂推理和大模型提供高速数据访问,满足新一代AI推理训练需求。存储软件厂商也在关注:WEKA Systems首席产品官提到,9650与其GPU内存扩展技术完美契合,可通过超快NVMe加速推理,帮助解决高吞吐任务中的“内存墙”问题。

行业影响与前景展望

Micron 9650的发布标志着企业级存储和AI计算基础设施进入了一个新阶段。对于AI训练,更快的存储意味着GPU不再因为等待I/O而空闲,数据管道得到极大优化。在实际应用中,这将显著缩短大规模模型的训练时间,加速迭代创新。对推理和检索类应用而言,极低延迟的高并发存储使模型能够快速访问外部知识库(如向量数据库等),提升检索式生成应用的实时性和准确性。

与此同时,9650带来的高性能/瓦特比优势和新品架构也促进了数据中心架构的演进。它支持液冷设计并消除了风扇,为高密度AI服务器提供了更好的散热和能耗方案。搭配Micron同期推出的超大容量6600 ION SSD(最高128TB/245TB),企业可极大提升存储密度——如1U机架可装载20块122TB的9650(4.88PB),相当于比传统U.2方案节省了67%空间。总体来看,Micron 9650不仅重新定义了企业SSD的性能基准,也预示着PCIe 6.0技术在AI和云计算领域的全面铺开。随着生态系统认证和产业化推进,它有望成为未来AI基础设施的关键存储支撑,加速整个行业向更加高效、绿色的方向发展。

下面是针对Micron 这款PCIe 6.0 SSD英文的一些有趣总结,包括和70年前的IBM 5MB字节磁盘相提并论,很有意思,仅供参考。

Micron's First PCIe Gen6 SSD

This August, Micron has unveiled the “9650” SSD, the industry’s first PCIe Gen6 NVMe storage device, powered by its in-house G9 NAND. Capable of: Sustained 28 GB/s sequential reads and 14 GB/s writes Up to 5.5 million random read IOPS and 900k write IOPS Up to 25% better storage energy efficiency on writes and 67% on reads compared to PCIe 5.0 SSDs  Why Should It Matter to You? The launch of the Micron 9650 shows real-world PCIe Gen6 deployment in enterprise AI, confirming the urgency for signal-conditioning solutions today even before specification maturity. High-speed SSDs like the 9650 highlight the need for robust interconnect validation tools across devices, platforms, and workloads. As data centers push towards Gen6 infrastructure, analog signal equalization and retiming (as delivered by advanced redrivers and retimers) will become essential to sustain signal quality and reliability. 

“9650” SSD,这是业界首款 PCIe Gen6 NVMe 存储设备,搭载其自主研发的 G9 NAND。其性能如下:持续 28GB/s 顺序读取和 14GB/s 写入;高达 550 万次随机读取 IOPS 和 90 万次写入 IOPS;与 PCIe 5.0 SSD 相比,写入存储能效提升高达 25%,读取存储能效提升高达 67%  为什么这对您如此重要?美光 9650 的发布展示了 PCIe Gen6 在企业 AI 中的实际部署,这证实了即使在规范成熟之前,当今信号调理解决方案的紧迫性。像 9650 这样的高速 SSD 凸显了跨设备、平台和工作负载的强大互联验证工具的需求。随着数据中心向 Gen6 基础设施迈进,模拟信号均衡和重定时(由先进的重驱动器和重定时器提供)对于维持信号质量和可靠性至关重要。

📷 1956 IBM 5MB Drive being shipped 

We just went to FMS and talked about storage for a whole week. So here's a reminder of how far we’ve come. In 1956, IBM shipped the world’s first computer to use a hard disk drive for data storage, the IBM 305 RAMAC, by freight. The drive weighed over a ton and stored just shy of 5 megabytes of data or about the equivalent of three minutes of scrolling Instagram on a mobile connection today. Housed in a cabinet the size of two refrigerators, it marked a groundbreaking moment in data storage history. Moving it required a forklift just to load and transport. IBM reportedly valued the disk drive at $50,000 in 1956, which would be more than $550,000 in today’s money. For comparison, you can buy a 1TB SD card, small enough to fit in a camera, for around $100 plus tax.

我们刚刚去了 FMS,讨论了整整一周的存储问题。让我们来回顾一下我们已经取得了多大的进步。1956 年,IBM 通过货运运送了世界上第一台使用硬盘驱动器存储数据的计算机 IBM 305 RAMAC。该驱动器重达一吨多,存储的数据略低于 5 MB,大约相当于今天通过移动连接浏览 Instagram 三分钟的内容。它被安置在一个相当于两个冰箱大小的柜子里,标志着数据存储历史上的一个突破性时刻。移动它需要用叉车来装载和运输。据报道,IBM 在 1956 年对该磁盘驱动器的估价为 50,000 美元,以今天的货币价值计算,超过 550,000 美元。相比之下,您可以花大约 100 美元加税购买一张 1TB 的 SD 卡,小到可以放进相机里。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐