新闻资讯 新闻资讯

德擎光学入选量子位【2025年度人工智能榜单 】

首页 行业观察

打造“冷静”的AI算力中心:激光焊接检测助力液冷散热高质量制造

发布时间:2026-06-05 访问量:42次 来源:激光焊接检测守护液冷散热系统可靠性

过去十年,数据中心的核心问题是算力。未来十年,这个问题可能变成散热。

随着AI服务器单颗GPU功耗从300W增长到1000W以上,风冷的物理经济性边界已被突破。以当前主流AI训练服务器为例,NVIDIA H100功耗约700W,NVIDIA B200功耗达到1000W以上,GB200 NVL72整柜功耗超过120kW。传统空气冷却方案在高功率服务器场景下逐渐遭遇散热能力限制,而Direct-to-Chip Liquid Cooling(冷板式液冷)正在成为主流方向[1]

ASHRAE(美国采暖、制冷与空调工程师协会)指出,AI和高性能计算(HPC)正在加速液冷技术在主流数据中心的普及。NVIDIA、Meta、Microsoft等科技企业也在公开技术路线中持续推进液冷基础设施建设。

就在6月1日的GTC Taipei 2026大会上,黄仁勋宣告英伟达下一代AI超级芯片平台Vera Rubin全面量产,Vera Rubin NVL72 机柜整合72颗Rubin GPU与36颗Vera CPU,采用100%液冷散热设计。

对于下一代高功率AI数据中心而言,液冷正在从“可选方案”变成“基础配置”[2]

随之而来的是中国液冷产业链迎来爆发,已形成覆盖关键零部件、液冷IT设备、整体解决方案及智算中心应用实践的完整产业生态,市场规模预计到2029年将达到约1300亿元[3]

【图1 液冷产业链,由AI算力革命推动的“多米诺骨牌”】 资料来源:中国信通院《智算中心液冷产业全景研究报告(2025)》、ODCC液冷技术白皮书、行业公开资料,德擎光学整理。

01 液冷系统里,藏着大量激光焊接工艺

液冷系统作为一套管路和冷却液循环系统,本质上也是一套复杂的金属连接系统。从冷板(Cold Plate)到CDU,再到分液器(Manifold),几乎每一个核心部件都需要激光焊接。

图2/3:数据中心液冷系统示意,来源:Open Compute Project (OCP) Cooling Environments Project - Liquid Cooling Technologies Overview

 

而激光加工质量,一定程度上决定了液冷系统的生死。

与动力电池类似,液冷系统最大的风险不是散热效率不够,而是泄漏。冷却液一旦泄漏,轻则服务器停机,重则 GPU 损坏,极端情况下甚至导致整个机房宕机,因此液冷行业对焊接等加工质量要求极高。

1. 冷板焊接 / 3D 打印冷板 

冷板内部通常包含微流道、流体腔体,需要将盖板与基板焊接密封。若焊接出现未熔合、裂纹,则可能形成慢渗漏,且问题往往在出厂检测时无法发现,在运行数月后暴露,潜在影响包括:冷却液泄漏、GPU 损坏、数据中心停机。

除此以外,日前行业已突破 3D 打印纯铜微通道冷板的量产瓶颈,此后金属增材制造将越来越多地承接冷板制造。而 3D 打印过程容易出现的未熔合、不合理支撑、鼓包、翘曲等缺陷,也将严重影响冷板的功用。

2. Manifold 分液器焊接

用于散热的管道装置,负责向多个冷板分配冷却液。其焊接质量直接决定压力稳定性、流量均匀性。

焊缝缺陷可能导致压降异常、流量失衡,影响整柜散热能力。

 3. CDU 焊接

CDU 是液冷系统心脏,涉及不锈钢管路、换热器、储液单元、大量焊接接头。

若焊接质量不足,可能导致泄漏、压力损失、整个液冷回路失效。

 4. UQD 快接头焊接

UQD(Universal Quick Disconnect)是用于快速断开的耦合器,实现液冷系统管路随时快速断开。由于液冷系统需要频繁维护,因此快接头要求零泄漏、高可靠、长寿命。

焊缝微裂纹可能在长期热循环后扩展,最终形成渗漏。

5. 波纹管/柔性连接件

波纹管(Flexible Bellows)通过自身弹性吸收振动和热膨胀应力,是保障液冷系统长期稳定运行的重要部件。

由于其通常处于持续振动和热循环环境中,波纹管与端管、法兰或接头连接处的焊接,即使出现极小的焊接缺陷,也可能在长期运行后逐渐扩展。

液冷部件

焊接目标

潜在缺陷

风险

冷板

密封性

未熔合

漏液

分液器

压力稳定

裂纹

流量失衡

CDU

系统可靠性

虚焊

系统失效

快接头

长寿命密封

微裂纹

长期渗漏

波纹管/柔性连接件

密封性

  未熔合、微裂纹

漏液

【图4 液冷系统激光焊接位置及其潜在缺陷和风险】

 

02 AI时代的液冷制造,正在走向100%在线检测

随着液冷产业规模扩大,传统抽检模式开始失效。因为液冷行业面对的海量检测任务:7×24小时运行、万卡集群、百亿级数据中心,而任何一个焊接缺陷都有可能被放大。

当焊接质量开始成为数据中心可靠性的关键变量时,激光焊接检测也将从“质量管理工具”,升级为AI基础设施的重要组成部分。因此越来越多液冷厂商开始采用激光焊接在线检测。

【图5 德擎液冷焊接检测方案】

AI时代正在重塑基础设施,而每一次基础设施的变革,都建立在对关键机理的深入理解和对制造品质的不懈追求之上。

面向快速发展的液冷产业,德擎光学将继续秉持“以感知 见未知”的理念,通过先进的激光焊接检测技术与专业服务能力,帮助产业伙伴看见制造过程中那些影响性能与可靠性的关键细节。我们期待与GPU、服务器、液冷系统及核心部件领域的合作伙伴一道,共同打造更加可靠、高效、可持续的下一代AI算力基础设施,为液冷产业高质量发展贡献力量。

 


参考文献

[1] Liquid cooling of data centers: A necessity facing challenges,作者:M. Azarifar 等,期刊:Applied Thermal Engineering https://www.sciencedirect.com/science/article/abs/pii/S1359431124007804?utm_source=chatgpt.com

[2] 中国信通院《智算中心液冷产业全景研究报告(2025年)》https://www.caict.ac.cn/kxyj/qwfb/ztbg/202508/t20250826_690829.htm?utm_source=chatgpt.com