一、利润分配:一台B200背后的“层层抽成”
理解AI算力产业链,套用一个递推公式最为直观:英伟达把芯片卖给云大厂 → 云大厂把算力租给OpenAI和Anthropic → OpenAI再把手伸向用户。
这种层层传导的关系,本质上就是逐层“剥洋葱”——每一层向上游采购后,在下游发生价格磨损之前,都需要先剥去一定厚度来确保自身的利润。
在最底层,SK海力士稳坐HBM供应商中的利润王座,2026年第一季度以72%的营业利润率刷新行业纪录,不仅超越了自身前一季度58%的高点,更以显著优势领先台积电同期的约58%。
三星的12层HBM3E利润率约30%,仅为SK海力士的一半。HBM占B200总物料成本的45%,已成AI芯片成本的最高单项。
第二层英伟达的定价权几乎不受限制。B200单颗物料成本约6400美元,包含两片GPU逻辑芯片、八组HBM3E内存和CoWoS-L先进封装,官方售价却高达约40000美元,毛利率维持在84%的惊人水平。
而在上一代H100时代,物料成本约3320美元,售价约28000美元,毛利率高达88%。
英伟达2026财年第一季度实现营收440.6亿美元,剔除H200影响后的毛利率仍有71.3%。
第三层云大厂的利润率已大幅稀释。谷歌云的经营利润率在2026年第一季度提升至33%,Amazon AWS约38%,Microsoft智能云约42%——与上游动辄70%以上的毛利率形成鲜明对比。
真正的利润落差,正是从云大厂这里开始的。
到了最终端,Anthropic 2025年总支出约97亿美元,仅算力一项就高达68亿美元,占总成本的约70%;算力支出在Anthropic、Minimax和智谱等AI公司中占比达57%至70%,全面压倒了人才薪酬。
二、现状能持续吗?
(一)囚徒困境与变现难题
四大云服务商2026年AI基础设施资本开支合计预计达6100亿美元,但发布财报后市值却蒸发了9500亿美元。
云大厂已陷入典型的“囚徒困境”——单独削减资本支出可能被市场解读为对AI前景的信心崩塌,进而在资本市场付出更高代价。
下游AI公司的财务状况更加堪忧。OpenAI预计2026年将亏损140亿美元,2023年至2028年累计亏损预计达440亿美元,最早2029年才有可能实现盈利。
更令人担忧的是,ChatGPT每周9亿用户中,仅约5%为付费用户。
这也是OpenAI被迫从“技术理想主义”回归广告变现的内在原因——预计2027年广告收入突破100亿美元。
当所有入口级产品最终都走向广告时,AI并未找到比互联网更优的商业模式。
(二)效率飞速提升
变现问题固然严重,但行业绝非静态不变。AI推理成本正在以“打了类固醇的”摩尔定律速度下降。
2020至2026年间,大语言模型Token价格下降了约600倍,经济型模型价格半衰期仅为1.10年,比摩尔定律的2年基准快约一倍。
OpenAI面向付费用户的算力利润率也从2024年末的约52%跃升至2025年10月的70%。这家最顶级的亏损大户,在算力使用效率上其实一直在改进。
软硬件架构创新是成本优化的主驱动力——全要素生产率残差解释了约103.7%的成本削减,而GPU硬件本身的贡献仅为-0.9%。
这意味着,只要工程创新持续推进,算力成本就有持续下降的空间。
三、商业模式:披着科技外衣的“制造业”?
将AI公司与传统互联网巨头对比,差异本质在于可变成本的存在。传统互联网巨头(谷歌、Meta等)的核心产品是软件和平台,复制成本趋近于零,网络效应形成后护城河极深。
而AI大模型公司面临高额固定成本(前期训练)与高额可变成本(每次推理),商业模式更接近制造业而非传统科技公司。
净利润数据也说明了问题:在OpenAI高达3000亿美元估值背后,其付费渗透率不足6%;Anthropic虽已实现年化营收约190亿美元且在2027年有望转正现金流,但利润率天花板明显低于传统互联网。
具有讽刺意味的是,当AI公司试图向“平台化”转型时,往往重走互联网巨头的老路——OpenAI从排斥广告到主动拥抱广告的转变,只不过是Google和Meta剧本的又一次重演。
如果最终商业模式殊途同归,那么披着创新外衣的重资产属性只会让这份生意更加难做。
四、总结
当前AI算力产业链呈现经典“橄榄形”利润分配:上游HBM和GPU厂商攫取绝大部分利润,下游AI应用厂商承担高昂算力成本而盈利困难。
这种结构短期内仍在运行——上游厂商利润惊人,下游巨头持续烧钱——核心取决于两股力量的拉锯:
一方面,算力成本的急速下降为AI公司提供了持续改善利润率的技术空间;
另一方面,愈演愈烈的资本“囚徒困境”与盈利模式的长期缺位,也使崩盘的风险始终存在。

夜雨聆风