AI 的钱最终落在哪一层:模型公司、云厂商,还是 SpaceX 的轨道?

来源：原创整合分析（基于公开资料）

时间：2026-05-08

5 月 6 日，Anthropic 拿下 SpaceX 在田纳西 Memphis 的 Colossus 1 数据中心全部算力——超过 300 MW、22 万颗英伟达 GPU——并与马斯克达成"多 GW 级轨道 AI 算力"的合作意向。这不是一笔普通的供货合同。它把一个埋在 AI 行业地基下的旧问题翻了出来：当聊天框背后的成本被压到极致，谁能站着把钱挣了？本文不预测胜负，只把这盘棋的三条可能终局摊开来看。

一、聊天框背后的暗战

普通用户打开 ChatGPT 或 Claude，看到的是一个干净的输入框。

输入框底下，是一条很长的价值链：模型权重在某个数据中心被加载、推理，请求穿过几层 GPU、网络、存储,最后吐出一段文字。这条链条里有两个角色长期在争夺定价权——一个是模型公司（OpenAI、Anthropic、xAI),一个是云服务商（AWS、Azure、Google Cloud、Oracle）。

过去两年的资本流动，表面上是"模型公司接受云厂投资"的故事。Microsoft 投 OpenAI、Amazon 投 Anthropic、Google 也投 Anthropic。但仔细看，钱根本没有从云流向模型，而是绕了一圈又流回去——

Amazon 一共向 Anthropic 注入近 330 亿美元，Anthropic 反手承诺未来十年向 AWS 采购 1000 亿美元的 Trainium 算力；

Google 准备向 Anthropic 投最多 400 亿美元，Anthropic 锁定 3.5 GW 的 Google TPU 容量，由 Broadcom 设计供应到 2031 年；

5 月 6 日的 SpaceX 大单，则是把 Colossus 1 整体打包给了 Anthropic。

短短一年里，Anthropic 一家公司，分别和三个云厂签下了 GW 级的长约。这种"反向制衡"已经不是简单的多供应商策略，而是模型公司用规模和确定性向上压云厂的边际利润。

值得问的，是更底层的一个问题：

这场 AI 牌局，最后的钱会留在哪一层？是写聊天框的模型公司，还是托着聊天框的云？

二、模型层为什么会赢：一个被低估的"感知差"

要理解这个问题，先看一个非常朴素的事实——用户的"感知差"。

换一个模型，用户立刻能感觉到。Claude 和 GPT 的语气不一样、能力边界不一样、记忆和上下文不一样。一个长期用 Claude 写代码的人切去 ChatGPT，要重新熟悉它的代码风格、调试节奏、prompt 习惯。一个用 ChatGPT 处理文档的人切到 Gemini，会觉得"答得不一样"。模型在用户面前是有"人格"的。迁移成本是真实存在的。

换一个云服务商，用户什么都感觉不到。

你今天发出的一条 ChatGPT 请求，可能落在 Azure 的 H100 上，也可能落在 Stargate 项目的 GB200 上，明天还可能落在 Oracle 的机房里——你无从分辨，也不会在乎。云对终端用户来说，是被模型公司彻底封装的中间件。

这一感知差，决定了 AI 价值链的天然倾向：模型层是"前台"，占据用户的注意力入口和习惯护城河；云层是"被吞没的后台"，永远在用户视线之外。

由此推出第一个推论：模型公司可以"上吃"云的利润。

逻辑直白：模型公司一旦有了钱（Anthropic 的年化收入已经从 2025 年底的 90 亿美元跳到 2026 年的 300 亿美元以上，OpenAI 更高），最理性的动作就是把成本结构里最大的一块——算力——往体内拉。OpenAI 牵头的 Stargate 项目，号称十年 5000 亿美元、10 GW 自有数据中心；Anthropic 一边和 AWS 签 1000 亿长约，一边在 Trainium 这种"准内部芯片"上深度下注，今天已经在用超过一百万颗 Trainium2 训练 Claude。

反过来，云服务商想"上吃"模型公司，必须做一件难得多的事：做出一个用户愿意切过来的模型。Microsoft 推 Copilot、Google 推 Gemini、Amazon 推 Nova。但用户的工作流已经长在某一家的产品上——切换的成本是真实的几十小时，不是一句"我们也有 AI"能解决。

ChatGPT 这种产品形态本身就是一台习惯收割机：在每一次低门槛的日常任务里建立信任，再把信任带进企业。每一次让用户满意完成任务，模型层就增加一点点不可替代性。

所以静态来看，价值缓慢向模型层迁移，是有逻辑根据的。

三、云为什么不甘心：合同、芯片、和一种"未必赢但必须打"的牌

但云厂商也没坐着等死。

第一招，用钱锁死。 Amazon 之于 Anthropic、Microsoft 之于 OpenAI、Google 之于 Anthropic——这些投资本质上是用股权换一份巨额的、有期限的算力采购合约。1000 亿美元 / 10 年的 AWS 长约、400 亿美元投 Anthropic 换 3.5 GW TPU 容量，这些数字本身就是云厂在锁定 AI 时代最稀缺的资源——确定的算力消耗。

第二招，把芯片做成自己的护城河。 Trainium、TPU、Maia、Graviton——头部云厂这两年自研芯片的节奏都不慢。它们的逻辑很清楚：如果模型公司绕开 GPU 自建数据中心，云厂只是 GPU 转售商，毛利会被压到很难看；但如果云厂把"硅 + 数据中心 + 软件栈"打包成一个独家方案，模型公司就算想自建，也得至少先在云厂的体系里训出能用的下一代模型——这是一个真实的迁移成本。Anthropic 用一百万颗 Trainium2 训练 Claude 这件事，就是这个策略的成果。它在 AWS 体系里训得越深，越难轻易迁出去。

第三招，直接造模型。但坦率说，这一招最不灵——Gemini 在 ToB 市场没干掉 Claude，Microsoft 自家的 Phi 也没替代 OpenAI。模型这个产品，"做得出来"和"用户愿意切过来"之间隔着一条很宽的护城河。

把这两回合叠在一起看：模型公司有用户感知的优势，云厂有资本和硅片的优势。但前者的优势是结构性的（用户习惯），后者的优势是合同性的（长约和投资）。合同会到期，习惯不会。

如果故事到这里就结束了，价值会缓慢但不可逆地向模型层迁移。

但故事没到这里。

四、SpaceX 的"维度上升"：把云的成本拉到一个跨学科的物理学问题

SpaceX 这一手，跟前面所有玩家不在同一个棋盘上。

5 月 6 日宣布的合作里，最容易被忽略的一句话是这个：Anthropic 和 SpaceX 表达了"未来共同开发多 GW 级轨道 AI 算力"的意向。Colossus 1 那 22 万颗 GPU 当然重要，但那只是一笔标准的地面算力订单。真正让这笔交易"不一样"的，是后半句。

把这句话翻译成更直白的版本：SpaceX 想把数据中心搬上太空。

听起来像科幻。但 2026 年 1 月底，SpaceX 已经向 FCC 提交了一份完整的申请文件——一组多达一百万颗的"轨道数据中心"卫星星座，部署在 500-2000 公里低轨、30 度倾角与太阳同步轨道，最大化光照时间。SpaceX 在文件中写道，目标是让百万吨级的卫星每年发射，最终承载 100 GW 的 AI 算力——这个数字相当于美国当前总用电量的 20%。配套计划包括：用 Starlink V3 卫星做高带宽光链路中继接地，2026 年下半年开始在 Starlink V3 硬件上试点在轨算力节点。

xAI 在 2026 年初被 SpaceX 收购，火箭、卫星、云、芯片、模型——全栈合龙。

为什么是太空？把"算力"这件事拆开看，无非三个变量：能源、散热、通信。

能源。太空里的太阳能，光照强度比地面高 36%，容量因子超过 95%（地面太阳能美国中位数只有 24%）。Starcloud 给出的估算是 0.002 美元 / 度电，地面同口径是 0.045-0.17 美元 / 度电——相差一到两个数量级。

散热。地面数据中心要靠水冷,一座大型数据中心一天能用 500 万加仑水。在太空里，背景温度 -270℃，被动辐射散热不烧电、不耗水，效率比地面任何冷却塔都高几个量级。

通信。这是过去做不成的瓶颈，但 Starlink V3 的星间光链路第一次让"轨道算力 → Starlink → 地面"这条数据通路具备了商业可行性。

把这三件事加起来，结论非常直白：如果太空算力跑通了，云的成本不是降一点，而是降一个台阶。

当然，今天还远没跑通。当前 1 GW 轨道数据中心五年综合成本估算约 510 亿美元，地面对应约 160 亿，仍然贵三倍。Google 内部的 Project Suncatcher 自己算过一笔账：发射成本要降到 200 美元 / 公斤以下，太空算力才能反超地面——而 Falcon 9 现在是 2720 美元 / 公斤、Falcon Heavy 是 1500 美元 / 公斤，预计要到 2030 年代中期 Starship 全面铺开才达临界点。Starcloud 给出的乐观数字是"5 GW 轨道集群，十年总成本只有地面的 1/20"，但这个数字建立在 Starship 大规模降本的假设之上。

换句话说，这是一个未来五到十年才能验证的赌局。

但只要"轨道算力比地面便宜"这件事被证明了，整张牌桌就会被掀翻。

云不再是"可以被模型公司封装的中间件"——它变成了"模型公司复制不出来的能力"。

OpenAI 可以自建地面数据中心，可以采购英伟达 GPU，可以挖来一支硬件团队。但它没法自己造火箭、放卫星、运营低轨网络。这是一个跨越物理学和资本门槛的能力。Stargate 那 5000 亿美元的预算，相对 SpaceX 的发射量级，仍然不够。

那时候的剧本会变成：模型公司必须租 SpaceX 的算力，反过来给云交税。

五、终局：三条可能的路径

现在把镜头拉远，画面就清楚了。AI 价值链未来五到十年大概率会走出三条路径中的某一条——

路径 A：模型公司自建走通。

OpenAI 的 Stargate 项目按预算落地、Anthropic 把 Trainium / TPU 上的训练效率拉到自有水平。GPU 供应链不再卡脖子，电力和土地能拿到。这种情况下，模型公司在前端有用户习惯护城河，在后端有内部化的算力——价值整体流向模型层，云厂沦为标准化的 IaaS 供应商，毛利长期承压。

路径 B：太空算力跑通。

Starship 把发射成本压到 200 美元 / 公斤以下，SpaceX 或后来者的轨道数据中心进入商业化。这一情景下，云重新拥有了模型公司无法复制的物理优势。模型公司必须按使用量给"太空云"交税，价值反向流回云层——更准确地说，流回拥有低成本物理基础设施的玩家。

路径 C：垂直整合者通吃。

SpaceX 收购 xAI，已经把这条路走出来了一截。火箭、卫星、地面网络、芯片、模型，全栈握在一家公司里。如果这家公司既掌握用户感知的"前台"（Grok），又掌握别人复制不出来的"后台"（轨道算力），它的护城河会同时跨过两个维度。

值得注意的是，今天 SpaceX 把 Colossus 1 卖给 Anthropic，而不是优先留给自家 xAI——这个动作本身耐人寻味。它说明 SpaceX 当前阶段更愿意当"算力批发商"，先把现金流和数据中心规模撑起来，再用 6 月 IPO 的资金去做轨道部署。这是一个非常老练的资本策略：用模型公司的钱，烧自己的飞船。

三条路径并不互斥，更可能是叠加发生。但只要太空算力这一项哪怕走出 20%，AI 价值链的天平都会从今天的"模型层占优"被重新调整。

六、聊天框背后

回到普通用户那一面。

当一个人打开 Claude 或 ChatGPT，敲下问题、等待回答的时候，他不会知道这条请求最终落在 Memphis 的 Colossus 1，还是 AWS 弗吉尼亚机房的 Trainium2，还是十年后的某颗低轨卫星上。他不会知道这家公司这一年和哪三家云签了多少 GW 长约，也不会知道发射价格降到 200 美元 / 公斤这件事和他每月 20 美元订阅之间的关系。

但他每多用一天 Claude，模型层的护城河就深一寸；模型公司每多签一年长约，云厂的合同覆盖就久一点；SpaceX 每多发一次 Starship，轨道经济的临界点就近一步。

聊天框很安静。聊天框的背后，是一场从消费者注意力，到深海中的光纤，到田纳西的 22 万颗 GPU，再到几百公里高空太阳板的、横跨几个物理尺度的资本和工程战争。

最后的钱会落在哪一层，今天没人知道。但有一件事是确定的——这场仗的胜负，不会在聊天框里见分晓，而会在比聊天框低得多、也高得多的地方决出。