算力狂飙，散热告急：两相冷板为何成为AI数据中心的“救命稻草”？

摘要：随着AI芯片功耗突破1.5千瓦，传统散热技术面临极限，两相冷板液冷技术凭借相变传热优势成为关键解决方案。该技术能处理500W/cm²以上的热流密度，显著降低能耗（PUE 1.08-1.12），并保持芯片温度均匀。中国冷泉能控等企业已实现规模化商用，采用可调沸点工质和智能控制系统。尽管存在成本高、标准缺失等挑战，两相冷板液冷仍是AI算力持续增长的必要选择，未来或向智能化工质、芯片集成等方向发展

weixin_46307566

661人浏览 · 2025-12-31 17:35:44

weixin_46307566 · 2025-12-31 17:35:44 发布

当单颗AI芯片功耗突破1.5千瓦，机柜功率密度逼近100kW，传统风冷早已力竭，单相液冷也接近天花板。唯有两相冷板液冷——这项利用液体沸腾吸热、蒸汽冷凝放热的相变技术，正从实验室加速走向真实战场。而在中国，已有企业悄然完成从样机到规模化部署的关键一跃。

一、AI算力爆炸，散热成了最大瓶颈

过去五年，AI训练算力需求年均增长超300%。以NVIDIA最新Blackwell架构为例，单卡TDP已突破1000W，若采用多芯片模组（MCM）设计，整卡功耗可达1.5kW以上。当数十张这样的卡密集部署于单机柜，芯片局部热流密度已普遍超过300 W/cm²，部分热点甚至逼近600 W/cm² [1]。

作为对比

传统风冷：可靠处理上限约 0.1 W/cm²；
单相液冷：工程化应用上限通常在 80–120 W/cm²；
两相冷板液冷：可稳定应对 500 W/cm² 以上的热负荷。

更严峻的是，AI训练任务常需连续满载运行数周甚至数月，对散热系统的长期稳定性、温度均匀性、能耗效率提出极致要求。

散热，不再是配套工程，而是决定AI基础设施上限的核心变量。

二、为什么是两相冷板？

两相冷板液冷的核心原理，是在紧贴芯片的微通道内注入低沸点工质，使其受热后沸腾汽化（吸收大量潜热），蒸汽被导出至冷凝器液化放热，再回流至冷板，形成闭环。

【图2：两相 vs 单相传热对比示意图】

三大不可替代优势：

超高热流密度处理能力实测CHF（临界热流密度）可达 500–800 W/cm²，足以覆盖当前及下一代AI芯片需求。
极低泵功与系统PUE 相变传热效率高，所需流量小，泵功比单相方案低30%~60%。实测数据中心PUE可稳定在 1.08–1.12 区间 [2]。
芯片温度高度均匀沸腾过程维持近恒温，避免局部热点，延长GPU寿命并提升计算稳定性。

三、全球落地者寥寥，中国已有实践突破

目前，真正将两相冷板用于商业AI/HPC场景的企业屈指可数。国际上，Vertiv、Fujitsu、Submer等凭借多年积累率先布局。

而在中国，冷泉能控成为首个公开披露规模化商用案例的公司。据中国信通院《高密度液冷技术应用案例集（2024）》记载，其已完成H100的实机连续测试完成 [3]。

冷泉能控的技术路径亮点：

可调沸点定制氟化液采用自研环保型合成工质，沸点可在40°C至60°C范围内按需调配。这一设计巧妙匹配不同数据中心的冷却水温条件——在南方高温地区选用高沸点配方，在北方或冬季可切换低沸点模式，最大化相变效率。
微通道冷板 + 智能控制冷板内部采用微柱阵列增强成核，提升沸腾均匀性；系统集成压力、温度、液位多维传感，实现动态调节充注量与冷凝强度。
封闭但本地化工质配方虽未公开，但由国内化工企业协同开发，确保供应链安全，并针对国产铝材优化兼容性。

四、国际玩家如何选择？

• Vertiv（美国）

采用R1234ze（HFO类），沸点约−19°C，环保性能优异，但属微燃物质，需复杂安全设计。

• Fujitsu（日本）

坚持使用R245fa（HFC类），不燃、稳定，但环保性差，面临政策淘汰风险。

• Submer（荷兰）

基于Asperitas技术，使用高沸点氟化液（~50°C），支持无泵被动回流，但工质封闭、成本高昂。

可见，无论开放还是封闭，工质与系统深度耦合已成为行业共识。

五、挑战犹存：成本、标准与生态

尽管优势显著，两相冷板仍未大规模普及，原因在于：

初期成本高：冷板加工精度要求高，工质价格是水的百倍以上；
运维门槛高：需专业人员处理充注、排气、泄漏；
缺乏统一标准：接口、工质、安全规范尚未形成行业共识；
用户习惯滞后：多数客户仍倾向“够用就好”的单相方案。

尤其在中国，如何平衡技术先进性、供应链安全、成本可控性，仍是产业界共同课题。

六、未来已来：两相冷板将如何演进？

工质智能化未来工质或可根据负载动态调整沸点，实现“芯片-工质”协同优化。
冷板与封装融合如Intel、AMD探索的“chiplet + 内嵌冷板”一体化设计，将散热通道直接集成到芯片基板。
AI驱动的控制系统利用机器学习预测热负荷变化，提前调节工质流量与冷凝强度，提升瞬态响应能力。

结语：散热革命，才刚刚开始

两相冷板液冷不是炫技，而是AI时代基础设施的必然选择。当算力竞赛进入深水区，谁能在散热上领先一步，谁就握住了通往下一阶段的钥匙。

而中国的实践表明：我们不仅有能力跟进，更有机会在特定场景实现差异化突破。

📌 互动讨论：

在当前成本与技术条件下，两相冷板是否值得在普通AI集群中推广？

沸点可调的工质设计，是技术亮点还是过度复杂？

你更信任“开放标准工质”还是“封闭优化系统”？欢迎留言激辩！

参考文献（公开可查）：

[1] NVIDIA. Blackwell Architecture Technical Brief, 2024. [2] 中国信息通信研究院. 《高密度液冷技术应用案例集（2024）》. [3] 同上，第35页. [4] Kandlikar S G. Critical Heat Flux in Flow Boiling, Heat Transfer Engineering, 2020. [5] Vertiv. Two-Phase Liquid Cooling for AI Workloads, White Paper, 2022.