
James Watt
摘要: 大家都盯着 GPU,盯着大模型,却很少有人问一句:那么多卡挤在机柜里,热量怎么散?答案是液冷。而液冷系统里最不起眼、却最容易漏、最难标准化的一环,是 UQD 快速接头和它背后那台叫 CDU 的「心脏泵站」。 立仁兄从业IT行业30年,从事液冷计算也有6年了,今天想从一根不锈钢管路、一个 OCP 标准编号讲起,聊聊这门「卖水管给挖金子的人」的生意,为什么是 AI 时代最确定的一笔账,以及易链在这条供应链上,究竟把哪几颗螺丝拧到了别人拧不动的位置。
一分钟浓缩版
• 风冷已到物理天花板:单机柜功率冲过 100kW,传统风冷散不掉,液冷不是选项是必答题。 • CDU 是液冷的心脏,UQD 是它的血管接口:OCP 把 UQD 写进规范(Universal Quick Disconnect),就是要终结「一家一个接头」的乱象——标准化才有大规模供应链。 • 真正的护城河在传感器与管路集成:流量计、压力/温度/液位传感器、观油镜,缺一个系统就成了「盲人开车」。 • 易链的位置:不锈钢管路集成 + OCP UQD 快接头 + CDU 整机,一条龙交付,这是「淘金热里卖铲子」的硬通货生意。 • 算力与算料同源:液冷散下来的每一度电,最终都要靠「算料·AI 变现」赚回来——硬件是地基,数据才是楼。
正文
一、历史不会重复,但会押韵:从蒸汽机的「散热」说起
立仁兄读货币史,最爱看的是「瓶颈在哪里,钱就流到哪里」。
1769 年瓦特改良蒸汽机,真正卡住产能的从来不是火烧得旺不旺,而是冷凝器散不散得掉热——瓦特那项著名专利,核心恰恰是「分离式冷凝器」。一百多年后,这一幕在数据中心里几乎原样重演:今天卡住 AI 算力的,不是 GPU 不够强,而是热量散不掉。
数字很直白。十年前一个标准机柜功率大约 5–8kW,风扇吹吹就够了。到了英伟达 GB200 NVL72 这一代,单机柜功率直接冲到 120kW 以上。空气的比热容只有水的约四千分之一——这是物理常数,不是工程师努努力就能改的。所以行业的判断高度一致:风冷已死,液冷为王。据 Omdia、Dell'Oro 等多家机构测算,数据中心液冷市场未来五年复合增长率普遍在 25%–35% 区间,到 2028 年规模有望突破百亿 USD。
但仁兄想给一个反直觉的提醒:液冷的钱,不会主要流向「液」,而会流向「接口」和「控制」。 水谁都买得到,真正难的是怎么让水安全、精准、可热插拔地流过几千个 GPU 而不漏一滴。
二、CDU 与 UQD:液冷系统里那颗「心脏」和那截「血管」
讲两个名词,讲透了你就懂了整条供应链。
CDU(Coolant Distribution Unit,冷却液分配单元) 是液冷系统的心脏泵站。它把冷却液加压、分配、回收,隔离一次侧(楼宇冷源)和二次侧(机柜),还要实时调节流量与温度。一台 CDU 失效,整排机柜瞬间过热宕机——它的可靠性要求,接近金融系统里清算中心的等级。
UQD(Universal Quick Disconnect,通用快速接头) 是连接 CDU、Manifold 与服务器冷板的「血管接口」。它的关键词是「快」和「不漏」:运维要在机器带液运行时热插拔一块冷板,接头必须做到「断开瞬间双向自封」,一滴不漏地滴到主板上。
这里有个标准编号值得记下来:OCP(开放计算项目)在其液冷规范体系中,专门推动了 UQD 的标准化,目标就是终结过去「每家一个私有接头、互不兼容」的混乱。为什么这件事重要?因为立仁兄做金融工程出身,深知一个道理:没有标准,就没有规模化供应链;没有规模化,成本就降不下来。 OCP UQD 之于液冷,正如 ISO 集装箱标准之于全球航运——巴菲特喜欢的「收费桥」生意,往往就藏在这种不起眼的标准件里。
三、最容易被忽略的「神经末梢」:传感器,决定系统是聪明还是瞎
如果说 CDU 是心脏、UQD 是血管,那一整套传感器就是神经系统。这恰恰是大多数人看液冷时漏掉的部分,也是仁兄认为最该讲清楚的一节。
一台合格的 CDU,至少要集成这几类「神经末梢」:
• 流量计:监测冷却液流速,流量不足意味着散热不够,GPU 会降频甚至停机; • 压力传感器:监测管路压力,异常升高往往是堵塞或冰堵的前兆; • 温度传感器:进出口温差是判断散热效率的核心指标; • 液位传感器:防止系统缺液空转,泵一旦空转几秒就可能损坏; • 观油镜(视液镜):最朴素也最可靠的「人眼检漏」,让运维一眼看到液体里是否有气泡或杂质。
少一个,系统就成了「盲人开车」。立仁兄想强调一个反直觉判断:液冷竞争的下半场,不比谁的泵更大,而比谁的数据更全。 谁能把这套传感器数据采全、采准、采得便宜,谁就握住了从「卖硬件」走向「卖运维 SaaS」的入场券——这也正是 ACP 体系里「算料」逻辑在工业场景的延伸。
四、易链的位置:把整条「水路」一次性焊死交付
讲了这么多,落到自家生意。易链科技在这条供应链上的位置,可以用一句话概括:不锈钢管路集成 + OCP UQD 快接头 + CDU 整机,一条龙交付。
这件事的难点不在单个零件,而在「集成」二字。一套液冷系统,管路是不锈钢的,接头是 OCP UQD 标准的,泵和换热器要匹配,传感器要联调,还要通过严苛的耐压与气密测试。客户最怕的就是「东买一个接头、西买一台泵」,最后漏水了互相甩锅。易链做的,是把整条水路从设计、焊接、组装到测试一次性焊死交付,出问题只找一家。
这背后是仁兄一贯的姿态:不重造轮子,但要做别人做不好的脏活累活。 不锈钢管路集成、洁净度控制、UQD 量产一致性——这些没有性感故事,却是真金白银的护城河。每周立仁兄团队还会出一份《液冷周报》,把行业产能、标准动向、价格信号同步给同行与客户——这本身也是一种「算料」:把分散的产业信息,变成可决策的情报。
五、终局:硬件是地基,算料·AI 变现才是那栋楼
最后回到最根本的问题——以终为始:这门生意,最终卖给谁、创造什么价值?
液冷、CDU、UQD,本质上都是为了让 AI 算力跑得起来、跑得稳、跑得省。但散下来的每一度电,最终都要靠算力之上的应用赚回来。立仁兄常说一句话:硬件是地基,数据才是楼。 易链做液冷,不是为了当一个卖水管的代工厂,而是要顺着算力这条河,走到下游的「算料·AI 变现」——用沉淀下来的产业数据、运维数据、客户数据,反哺到内容生产、营销传播、业务转化的全链路里。
这是一盘大棋:用最确定的硬件生意(液冷)养出现金流,用最高弹性的数据生意(算料 AI)博未来。 一手收费桥,一手成长股,这才是仁兄理解的、穿越周期的产业布局。
📣 关注仁兄,每周一篇硬核 AI 变现、AI 落地,支持您消除 AI 焦虑。
参考资料:
1. Open Compute Project, 《OCP Cold Plate & Universal Quick Disconnect (UQD) Specifications》 — OCP 官网规范库 2. Dell'Oro Group, 《Data Center Physical Infrastructure Report》(液冷市场增速测算) 3. Omdia, 《Data Center Thermal Management Market Tracker, 2024》 4. NVIDIA, 《GB200 NVL72 Datasheet》(单机柜功率与液冷需求) 5. James Watt, British Patent No. 913 (1769) — 分离式冷凝器(散热瓶颈的历史镜鉴) 6. 易链科技《液冷周报》(产能·标准·价格信号,每周更新)
夜雨聆风