AI算力产业链的“层层拔皮”,还能够持续多久?

一、利润分配：一台B200背后的“层层抽成”

理解AI算力产业链，套用一个递推公式最为直观：英伟达把芯片卖给云大厂 → 云大厂把算力租给OpenAI和Anthropic → OpenAI再把手伸向用户。

这种层层传导的关系，本质上就是逐层“剥洋葱”——每一层向上游采购后，在下游发生价格磨损之前，都需要先剥去一定厚度来确保自身的利润。

在最底层，SK海力士稳坐HBM供应商中的利润王座，2026年第一季度以72%的营业利润率刷新行业纪录，不仅超越了自身前一季度58%的高点，更以显著优势领先台积电同期的约58%。

三星的12层HBM3E利润率约30%，仅为SK海力士的一半。HBM占B200总物料成本的45%，已成AI芯片成本的最高单项。

第二层英伟达的定价权几乎不受限制。B200单颗物料成本约6400美元，包含两片GPU逻辑芯片、八组HBM3E内存和CoWoS-L先进封装，官方售价却高达约40000美元，毛利率维持在84%的惊人水平。

而在上一代H100时代，物料成本约3320美元，售价约28000美元，毛利率高达88%。

英伟达2026财年第一季度实现营收440.6亿美元，剔除H200影响后的毛利率仍有71.3%。

第三层云大厂的利润率已大幅稀释。谷歌云的经营利润率在2026年第一季度提升至33%，Amazon AWS约38%，Microsoft智能云约42%——与上游动辄70%以上的毛利率形成鲜明对比。

真正的利润落差，正是从云大厂这里开始的。

到了最终端，Anthropic 2025年总支出约97亿美元，仅算力一项就高达68亿美元，占总成本的约70%；算力支出在Anthropic、Minimax和智谱等AI公司中占比达57%至70%，全面压倒了人才薪酬。

四大云服务商2026年AI基础设施资本开支合计预计达6100亿美元，但发布财报后市值却蒸发了9500亿美元。

云大厂已陷入典型的“囚徒困境”——单独削减资本支出可能被市场解读为对AI前景的信心崩塌，进而在资本市场付出更高代价。

下游AI公司的财务状况更加堪忧。OpenAI预计2026年将亏损140亿美元，2023年至2028年累计亏损预计达440亿美元，最早2029年才有可能实现盈利。

更令人担忧的是，ChatGPT每周9亿用户中，仅约5%为付费用户。

这也是OpenAI被迫从“技术理想主义”回归广告变现的内在原因——预计2027年广告收入突破100亿美元。

当所有入口级产品最终都走向广告时，AI并未找到比互联网更优的商业模式。

变现问题固然严重，但行业绝非静态不变。AI推理成本正在以“打了类固醇的”摩尔定律速度下降。

2020至2026年间，大语言模型Token价格下降了约600倍，经济型模型价格半衰期仅为1.10年，比摩尔定律的2年基准快约一倍。

OpenAI面向付费用户的算力利润率也从2024年末的约52%跃升至2025年10月的70%。这家最顶级的亏损大户，在算力使用效率上其实一直在改进。

软硬件架构创新是成本优化的主驱动力——全要素生产率残差解释了约103.7%的成本削减，而GPU硬件本身的贡献仅为-0.9%。

这意味着，只要工程创新持续推进，算力成本就有持续下降的空间。

将AI公司与传统互联网巨头对比，差异本质在于可变成本的存在。传统互联网巨头（谷歌、Meta等）的核心产品是软件和平台，复制成本趋近于零，网络效应形成后护城河极深。

而AI大模型公司面临高额固定成本（前期训练）与高额可变成本（每次推理），商业模式更接近制造业而非传统科技公司。

净利润数据也说明了问题：在OpenAI高达3000亿美元估值背后，其付费渗透率不足6%；Anthropic虽已实现年化营收约190亿美元且在2027年有望转正现金流，但利润率天花板明显低于传统互联网。

具有讽刺意味的是，当AI公司试图向“平台化”转型时，往往重走互联网巨头的老路——OpenAI从排斥广告到主动拥抱广告的转变，只不过是Google和Meta剧本的又一次重演。

如果最终商业模式殊途同归，那么披着创新外衣的重资产属性只会让这份生意更加难做。

当前AI算力产业链呈现经典“橄榄形”利润分配：上游HBM和GPU厂商攫取绝大部分利润，下游AI应用厂商承担高昂算力成本而盈利困难。

这种结构短期内仍在运行——上游厂商利润惊人，下游巨头持续烧钱——核心取决于两股力量的拉锯：

一方面，算力成本的急速下降为AI公司提供了持续改善利润率的技术空间；

另一方面，愈演愈烈的资本“囚徒困境”与盈利模式的长期缺位，也使崩盘的风险始终存在。