返回文章列表
服务器

液冷技术是什么?AI 智算中心为什么必须用液冷?

吱吱
2026-01-27
1周前
液冷技术是什么?AI 智算中心为什么必须用液冷?

在这个大模型(LLM)狂飙突进的时代,我们往往沉浸在 ChatGPT 的妙语连珠或 Sora 生成的惊艳视频中。但在这些“数字神迹”的背后,是一座座日夜轰鸣的算力工坊——智算中心。而此刻,这些智算中心正面临着一个前所未有的物理瓶颈:热量

随着英伟达 Blackwell 架构的发布,单机柜的功耗已经冲向了 120kW 甚至更高。传统的吹风扇散热(风冷)已经到了物理极限,就像是用电风扇去冷却一个正在全速运转的喷气发动机。于是,“液冷”这个曾经的小众技术,瞬间被推到了历史的舞台中央,成为决定AI进化速度的关键变量。


一、 算力的“沸点”:风冷为何不行了?

在计算机发展的几十年里,我们习惯了用空气带走热量。但AI改变了一切。AI训练需要建立高度集中化的GPU集群,随着GPU芯片算力的不断迭代,功耗也随之攀升。比如英伟达 H100 芯片的热设计功耗(TDP)已达 700W,而新一代 GB200 系统单机柜的热功耗更是高达 130kW-140kW。

20kW,是风冷的一道死线。 当单机柜功率超过 20kW 时,空气由于其比热容较低,散热效率会发生骤降。如果强行增加风扇转速,不仅会带来巨大的噪音污染,风扇本身消耗的电力甚至会占到服务器能耗的 15% 以上。

此外,温度每升高 10℃,电子元器件的可靠性就会下降 50%。采用液冷技术,可以将 CPU 的核心温度降低 10℃ 以上,从而使故障率大幅下降。数据证明,采用浸没式液冷的设备,其故障率比风冷低约 53%。

冷却效率硬核对

二、 技术拆解:冷板式 vs 浸没式

目前,液冷市场主要存在两种主流技术路径,它们像是两种完全不同的“降温哲学”。

1. 冷板式液冷(Cold Plate):目前的主流选择

冷板式液冷就像给芯片贴了一个“退烧贴”。它不改变服务器的整体架构,而是将一个装满循环冷却液的导热板(冷板)固定在 CPU、GPU 等高发热部件上。冷却液流过冷板带走热量,而不与电路板直接接触。目前,冷板式方案占据了中国液冷服务器约 95% 的市场份额,主要因为它技术成熟、兼容性强。

2. 浸没式液冷(Immersion):终极散热形态

浸没式液冷则更加硬核——直接将整台服务器“泡”在特制的绝缘液体(如硅油、氟化液)中。 液体与主板全面接触,换热效率达到极致。浸没式液冷的 PUE 值甚至可以降至 1.05 以下,几乎接近完美的能源利用率。阿里巴巴杭州数据中心就是浸没式液冷的典型案例,其 PUE 降至 1.09,节能效果显著。

两种主流液冷技术路径:各有千秋的算力降温方案


三、 政策与市场的“双重奏”

液冷服务器的爆火,不仅是技术的必然,更是政策的“强推”。

在全球“双碳”目标和我国“东数西算”战略下,数据中心的能耗标准被极其严格地量化。过去 PUE(能源使用效率)在 1.5 左右就可以接受,但现在许多新建项目要求 PUE 必须低于 1.25,甚至在上海等一线城市要求低于 1.15。在这样的政策红线下,风冷已经失去了生存空间,液冷成为实现绿色算力的唯一通途。

这是一个百亿美元的超级赛道。 根据 IDC 的数据,2024 年中国液冷服务器市场规模已经达到了 23.7 亿美元,同比增长 67.0%。预计到 2029 年,这一规模将飞跃至 162 亿美元,年复合增长率高达 46.8%。


四、 产业链上的巨头与玩家

在这场“算力灭火”大赛中,国内厂商正展现出极强的竞争力:

  • 中科曙光(Sugon): 作为国内浸没式液冷的先行者,其 ParaStor 液冷存储与服务器形成了“存算一栈式”方案,已在雄安数据中心等多个国家级项目中落地,服务于百度“文心一言”等训练集群。
  • 浪潮信息(Inspur): 拥有全栈液冷产品线,其单机柜功率可达 50kW。腾讯清远数据中心就部署了浪潮的液冷集群,年节省电费超千万。
  • 华为: 其边缘服务器 Atlas 500 采用冷板液冷,体积缩小 40%,能适应从极寒到酷暑的极端环境。
  • 超聚变(FusionPoD): 针对运营商智算中心推出了整机柜液冷方案,在供电和供液效率上处于行业领先水平。

五、 未来展望:液冷是算力的终点吗?

散热技术的进化,本质上是算力密度的不断挤压。随着 AI 算力需求呈指数级增长,液冷不再是一个“可选项”,而是智算中心的“标准配置”。

虽然目前液冷服务器的初始建设成本(CAPEX)比风冷高,但由于其带来的巨大节能效益,长期运营成本(OPEX)优势明显。通过节省电费、减少占地面积和降低设备维护成本,液冷数据中心整体的 TCO(总拥有成本)实际上更具吸引力。

展望未来,随着液冷技术的标准化,我们可能会看到更轻量化、更灵活的部署方式。正如润禾材料推出的浸没式液冷分布式算力一体机,正在助力 AI 向中小型企业下沉。散热革命的终点或许不在于液体本身,而在于让人类可以无限制地释放算力的潜能,而不必担心物理法则的惩罚。

“算力是数字经济的发动机,而液冷则是让这台发动机持续高速运转的血液。”

在这个被 AI 重新定义的时代,当我们在谈论千亿参数大模型时,请不要忘记那些在冷却液中静默运行的服务器。正是它们,在极度的高热中保持着冷静,承载着人类通往通用人工智能(AGI)的梦想。

数据来源参考:IDC、赛迪顾问、维谛技术、中原证券等行业权威报告

本文内容仅供参考,不构成任何专业建议。使用本文提供的信息时,请自行判断并承担相应风险。

分享文章
合作伙伴

本站所有广告均是第三方投放,详情请查询本站用户协议