乐于分享
好东西不私藏

AI芯片缺货的真正原因:氦气、溴、超级纯度硫酸,还有一个你不知道的战场

AI芯片缺货的真正原因:氦气、溴、超级纯度硫酸,还有一个你不知道的战场

你有没有这种感觉——

每次看到AI芯片的新闻,不是看不懂,就是看完了还是懵的。

英伟达H100显卡,2023年初还卖1万美元,现在市场价已经涨到快3万美元了。朋友圈有人说”这是泡沫,快跑”,也有人说”这才哪到哪,以后更贵”。

到底该信谁?

我花了一晚上用马斯克的第一性原理想清楚了一件事:这次涨价,不是泡沫,不是炒作,是一场你不知道的战争。


你知道吗?

芯片制造需要一种气体,叫氦气。听起来很普通对吧?

但全球氦气的主要来源之一,是卡塔尔和伊朗。

现在美国和伊朗的关系,你是知道的。

结果是什么?全球氦气价格在过去两年涨了超过40%,而且供应越来越不稳定。

这还没完。

芯片制造还需要溴——一种阻燃剂,广泛用于工业生产。还需要超级纯度硫酸——用于清洗晶圆表面,每生产一片芯片需要用到约10升。

这些材料的供应,都在受到地缘政治的冲击。

所以马斯克会说:涨价不是问题,问题是涨价的链条你没看到。


第一部分:马斯克的第一性原理是什么

先简单说一下马斯克这个思维框架,不然后面你看不懂。

第一性原理,就是遇到问题不要类比,不要看别人怎么干,而是要问:

“这件事的本质是什么?”

比如别人都说”电动车贵”,马斯克会问:”贵的本质是什么?是电池原材料贵,还是我们一直用错了方法?”

答案是:电池的原材料就是锂、钴、镍,这些东西的成本不是无限高的,只是之前没人用正确的方式提取和组合。

所以特斯拉自己造电池,成本就下来了。

好,记住这个思维。下面用这个框架看AI芯片。


第二部分:AI芯片涨价的本质是什么

第一层:AI需要什么?

答案是算力。大模型训练需要数以万计的GPU同时跑,这个没有捷径。

第二层:算力的本质是什么?

是晶体管数量乘以效率。H100在约800平方毫米的芯片上,集成了超过800亿个晶体管。

第三层:现在缺的是哪一环?

高端GPU,主要是英伟达的H100、H200,以及马上要量产的Blackwell B200。

第四层:为什么缺?

需求涨得太快,供给跟不上。

好,说到这,你可能会问:那建更多工厂不就行了?

没那么简单。有四个卡脖子的地方,你听懂了就知道为什么这波涨价不是暂时的。


第一重瓶颈:封装

GPU不是把芯片造出来就能用的,它需要把计算芯片和内存芯片”叠”在一起,这个技术叫CoWoS封装。

全球能做这件事的主要是台积电,产能严重不足。英伟达一家就锁定了台积电超过一半的先进封装产能。

需求大概是供给的1.4到1.6倍。这个缺口,即使台积电拼命扩产,也要到2026年下半年才可能缓解。


第二重瓶颈:内存

GPU速度快不快,内存很关键。AI GPU用的叫HBM内存,全球只有三家能做:SK海力士、三星、美光。

更麻烦的是,HBM每生产1比特,比普通内存多消耗约3倍的晶圆产能。

结果是:SK海力士的HBM产能已经全部被预订到2026年了。你现在下单,最快明年才能拿到货。


第三重瓶颈:制程

2026年,几乎所有主要AI芯片都转向台积电最新的3nm制程:英伟达Rubin、AMD MI350X、谷歌TPU v7、亚马逊Trainium3……

这意味着AI芯片会消耗台积电约60%的3nm产能,到2027年这个比例会到86%。

换句话说:台积电最好的产能,几乎全被AI包圆了。


第四重瓶颈:材料

这是我今天想加给你的那一层。

芯片制造需要大量特种材料:

  • 氦气:用于冷却和半导体制造,美国和伊朗的紧张关系直接影响了全球氦气供应链。
  • 溴:阻燃剂和阻燃材料,广泛用于工业生产。
  • 超级纯度硫酸:每片晶圆清洗需要约10升高纯度硫酸。

这些材料听起来不起眼,但没有它们,芯片就造不出来。

而这些材料的供应,都在不同程度地受到地缘政治的冲击。


结论:这不是周期性问题

好,到这里我们从底层推上来了。

为什么涨价?不是因为有人在炒作。

是因为:

需求爆发是结构性的——大模型技术革命带来的算力需求,不是用完就没了,而是会持续增长很多年。

产能扩张是慢的——从决定建厂到真正能出货,芯片行业通常需要3到5年。

瓶颈是一环扣一环的——封装、内存、制程、材料,四个地方同时卡,缺一不可。

所以马斯克会说:这不是周期性调整,这是结构性短缺。


第三部分:巨头们都在做什么

有意思的是,马斯克不仅用这个框架看问题,他还用这个框架做决策。

特斯拉怎么做的?自己造电池,自己写软件,自己设计芯片。

为什么?因为当核心资源被卡脖子的时候,唯一靠谱的解法,是自己掌控。

你再看看现在AI行业里大家在干什么——苹果:从2020年开始自己研发M系列芯片,彻底摆脱对英特尔的依赖。M4的神经引擎算力比M3翻倍,AI性能提升46%。

OpenAI:在开发自己的AI芯片Orion,已经组建了约20人的芯片团队,包括谷歌TPU项目的老将。微软已经表态,会用OpenAI设计的芯片。

华为:昇腾910C已经在大规模出货,目标是2025年出货70万片。910D正在开发,目标是超越英伟达H100。

Meta:和Broadcom合作开发MTIA芯片,签了跨越2029年的长期合同。

谷歌、亚马逊、微软……每一家都在做同一件事。

这说明什么?

说明这些最聪明的人,都得出了同一个结论:不能完全依赖英伟达。

英伟达的护城河是真实的,但不是不可挑战的。


第四部分:那么,投资怎么选

我用马斯克的另一个标准——产品思维:好不好用,能不能规模化。

英伟达:

好不好用?好用。CUDA生态有约400万开发者,这个护城河短期很难逾越。而且英伟达已经不只是芯片公司了,它的软件栈(NIM、NeMo)让它变成了平台。

能不能规模化?能。数据中心年收入已经突破1900亿美元,毛利率74%,产品路线图清晰:Hopper → Blackwell → Rubin。

但问题是什么?估值。3万亿美元市值,前向市盈率约40倍,已经定价了几乎完美的未来。上行空间有限,下行风险不小。

AMD:

MI300X规格很漂亮:192GB内存是H100的2.4倍,价格大概是英伟达一半。

但实测表现只有峰值算力的45%,而英伟达H100是93%。根本原因是软件效率的差距——ROCm比CUDA还是差一截。

不过ROCm在快速追赶,差距在缩小。AMD是给”愿意承担执行风险”的投资者的。

台积电:

这是我的判断里最稳健的选择。

好不好用?台积电的制程和封装技术,是真的不可替代。3nm和5nm制程已经占它家晶圆收入的74%,CoWoS封装几乎垄断。

能不能规模化?能。2025年收入增长预期30%,2025到2029年复合增长率40%。

估值也合理,前向市盈率约23到26倍,PEG比率0.7,市场有点低估了。


我的结论:

台积电是盾,最稳。 英伟达是矛,最锋利。 AMD是箭,高风险高回报。


最后说几句:

写这篇文章,不是要你明天就去买股票。

而是想告诉你一件事:

面对AI这个浪潮,焦虑是没用的。与其听别人吵来吵去,不如自己把问题想清楚。

第一性原理告诉我:涨价不是泡沫,是供需失衡,而且这链条比你想象的更长。

垂直整合告诉我:巨头在做什么,比他们说什么更重要。

产品思维告诉我:看公司不是看概念,是看能不能用,好不好用。

这三个框架,不只适用于AI芯片投资,也适用于你思考任何复杂问题。


下期预告:

下一期我们聊芒格。

芒格会用完全不同的角度看OpenAI——他会问:OpenAI的护城河到底在哪里?它的商业模式有什么致命问题?

格栅模型和逆向思考,会给我们一个很不一样的视角。

下周二见。


如果你觉得有收获:

关注公众号「ping的奇妙旅程」回复”清单”领取:

  • AI工具合集(我自己在用的工具清单)
  • 5个名人思维框架(马斯克、芒格、费曼、卡帕西、张一鸣)

每周二、五更新,用名人视角拆解AI和财经。