来源:原创整合分析(基于公开资料)
时间:2026-05-08
5 月 6 日,Anthropic 拿下 SpaceX 在田纳西 Memphis 的 Colossus 1 数据中心全部算力——超过 300 MW、22 万颗英伟达 GPU——并与马斯克达成"多 GW 级轨道 AI 算力"的合作意向。这不是一笔普通的供货合同。它把一个埋在 AI 行业地基下的旧问题翻了出来:当聊天框背后的成本被压到极致,谁能站着把钱挣了?本文不预测胜负,只把这盘棋的三条可能终局摊开来看。

一、聊天框背后的暗战
普通用户打开 ChatGPT 或 Claude,看到的是一个干净的输入框。
输入框底下,是一条很长的价值链:模型权重在某个数据中心被加载、推理,请求穿过几层 GPU、网络、存储,最后吐出一段文字。这条链条里有两个角色长期在争夺定价权——一个是模型公司(OpenAI、Anthropic、xAI),一个是云服务商(AWS、Azure、Google Cloud、Oracle)。
过去两年的资本流动,表面上是"模型公司接受云厂投资"的故事。Microsoft 投 OpenAI、Amazon 投 Anthropic、Google 也投 Anthropic。但仔细看,钱根本没有从云流向模型,而是绕了一圈又流回去——
Amazon 一共向 Anthropic 注入近 330 亿美元,Anthropic 反手承诺未来十年向 AWS 采购 1000 亿美元的 Trainium 算力;
Google 准备向 Anthropic 投最多 400 亿美元,Anthropic 锁定 3.5 GW 的 Google TPU 容量,由 Broadcom 设计供应到 2031 年;
5 月 6 日的 SpaceX 大单,则是把 Colossus 1 整体打包给了 Anthropic。
短短一年里,Anthropic 一家公司,分别和三个云厂签下了 GW 级的长约。这种"反向制衡"已经不是简单的多供应商策略,而是模型公司用规模和确定性向上压云厂的边际利润。
值得问的,是更底层的一个问题:
这场 AI 牌局,最后的钱会留在哪一层?是写聊天框的模型公司,还是托着聊天框的云?
二、模型层为什么会赢:一个被低估的"感知差"
要理解这个问题,先看一个非常朴素的事实——用户的"感知差"。
换一个模型,用户立刻能感觉到。Claude 和 GPT 的语气不一样、能力边界不一样、记忆和上下文不一样。一个长期用 Claude 写代码的人切去 ChatGPT,要重新熟悉它的代码风格、调试节奏、prompt 习惯。一个用 ChatGPT 处理文档的人切到 Gemini,会觉得"答得不一样"。模型在用户面前是有"人格"的。迁移成本是真实存在的。
换一个云服务商,用户什么都感觉不到。
你今天发出的一条 ChatGPT 请求,可能落在 Azure 的 H100 上,也可能落在 Stargate 项目的 GB200 上,明天还可能落在 Oracle 的机房里——你无从分辨,也不会在乎。云对终端用户来说,是被模型公司彻底封装的中间件。
这一感知差,决定了 AI 价值链的天然倾向:模型层是"前台",占据用户的注意力入口和习惯护城河;云层是"被吞没的后台",永远在用户视线之外。
由此推出第一个推论:模型公司可以"上吃"云的利润。
逻辑直白:模型公司一旦有了钱(Anthropic 的年化收入已经从 2025 年底的 90 亿美元跳到 2026 年的 300 亿美元以上,OpenAI 更高),最理性的动作就是把成本结构里最大的一块——算力——往体内拉。OpenAI 牵头的 Stargate 项目,号称十年 5000 亿美元、10 GW 自有数据中心;Anthropic 一边和 AWS 签 1000 亿长约,一边在 Trainium 这种"准内部芯片"上深度下注,今天已经在用超过一百万颗 Trainium2 训练 Claude。
反过来,云服务商想"上吃"模型公司,必须做一件难得多的事:做出一个用户愿意切过来的模型。Microsoft 推 Copilot、Google 推 Gemini、Amazon 推 Nova。但用户的工作流已经长在某一家的产品上——切换的成本是真实的几十小时,不是一句"我们也有 AI"能解决。
ChatGPT 这种产品形态本身就是一台习惯收割机:在每一次低门槛的日常任务里建立信任,再把信任带进企业。每一次让用户满意完成任务,模型层就增加一点点不可替代性。
所以静态来看,价值缓慢向模型层迁移,是有逻辑根据的。
三、云为什么不甘心:合同、芯片、和一种"未必赢但必须打"的牌
但云厂商也没坐着等死。
第一招,用钱锁死。 Amazon 之于 Anthropic、Microsoft 之于 OpenAI、Google 之于 Anthropic——这些投资本质上是用股权换一份巨额的、有期限的算力采购合约。1000 亿美元 / 10 年的 AWS 长约、400 亿美元投 Anthropic 换 3.5 GW TPU 容量,这些数字本身就是云厂在锁定 AI 时代最稀缺的资源——确定的算力消耗。
第二招,把芯片做成自己的护城河。 Trainium、TPU、Maia、Graviton——头部云厂这两年自研芯片的节奏都不慢。它们的逻辑很清楚:如果模型公司绕开 GPU 自建数据中心,云厂只是 GPU 转售商,毛利会被压到很难看;但如果云厂把"硅 + 数据中心 + 软件栈"打包成一个独家方案,模型公司就算想自建,也得至少先在云厂的体系里训出能用的下一代模型——这是一个真实的迁移成本。Anthropic 用一百万颗 Trainium2 训练 Claude 这件事,就是这个策略的成果。它在 AWS 体系里训得越深,越难轻易迁出去。
第三招,直接造模型。 但坦率说,这一招最不灵——Gemini 在 ToB 市场没干掉 Claude,Microsoft 自家的 Phi 也没替代 OpenAI。模型这个产品,"做得出来"和"用户愿意切过来"之间隔着一条很宽的护城河。
把这两回合叠在一起看:模型公司有用户感知的优势,云厂有资本和硅片的优势。但前者的优势是结构性的(用户习惯),后者的优势是合同性的(长约和投资)。合同会到期,习惯不会。
如果故事到这里就结束了,价值会缓慢但不可逆地向模型层迁移。
但故事没到这里。
四、SpaceX 的"维度上升":把云的成本拉到一个跨学科的物理学问题
SpaceX 这一手,跟前面所有玩家不在同一个棋盘上。
5 月 6 日宣布的合作里,最容易被忽略的一句话是这个:Anthropic 和 SpaceX 表达了"未来共同开发多 GW 级轨道 AI 算力"的意向。Colossus 1 那 22 万颗 GPU 当然重要,但那只是一笔标准的地面算力订单。真正让这笔交易"不一样"的,是后半句。
把这句话翻译成更直白的版本:SpaceX 想把数据中心搬上太空。
听起来像科幻。但 2026 年 1 月底,SpaceX 已经向 FCC 提交了一份完整的申请文件——一组多达一百万颗的"轨道数据中心"卫星星座,部署在 500-2000 公里低轨、30 度倾角与太阳同步轨道,最大化光照时间。SpaceX 在文件中写道,目标是让百万吨级的卫星每年发射,最终承载 100 GW 的 AI 算力——这个数字相当于美国当前总用电量的 20%。配套计划包括:用 Starlink V3 卫星做高带宽光链路中继接地,2026 年下半年开始在 Starlink V3 硬件上试点在轨算力节点。
xAI 在 2026 年初被 SpaceX 收购,火箭、卫星、云、芯片、模型——全栈合龙。
为什么是太空?把"算力"这件事拆开看,无非三个变量:能源、散热、通信。
能源。太空里的太阳能,光照强度比地面高 36%,容量因子超过 95%(地面太阳能美国中位数只有 24%)。Starcloud 给出的估算是 0.002 美元 / 度电,地面同口径是 0.045-0.17 美元 / 度电——相差一到两个数量级。
散热。地面数据中心要靠水冷,一座大型数据中心一天能用 500 万加仑水。在太空里,背景温度 -270℃,被动辐射散热不烧电、不耗水,效率比地面任何冷却塔都高几个量级。
通信。这是过去做不成的瓶颈,但 Starlink V3 的星间光链路第一次让"轨道算力 → Starlink → 地面"这条数据通路具备了商业可行性。
把这三件事加起来,结论非常直白:如果太空算力跑通了,云的成本不是降一点,而是降一个台阶。
当然,今天还远没跑通。当前 1 GW 轨道数据中心五年综合成本估算约 510 亿美元,地面对应约 160 亿,仍然贵三倍。Google 内部的 Project Suncatcher 自己算过一笔账:发射成本要降到 200 美元 / 公斤以下,太空算力才能反超地面——而 Falcon 9 现在是 2720 美元 / 公斤、Falcon Heavy 是 1500 美元 / 公斤,预计要到 2030 年代中期 Starship 全面铺开才达临界点。Starcloud 给出的乐观数字是"5 GW 轨道集群,十年总成本只有地面的 1/20",但这个数字建立在 Starship 大规模降本的假设之上。
换句话说,这是一个未来五到十年才能验证的赌局。
但只要"轨道算力比地面便宜"这件事被证明了,整张牌桌就会被掀翻。
云不再是"可以被模型公司封装的中间件"——它变成了"模型公司复制不出来的能力"。
OpenAI 可以自建地面数据中心,可以采购英伟达 GPU,可以挖来一支硬件团队。但它没法自己造火箭、放卫星、运营低轨网络。这是一个跨越物理学和资本门槛的能力。Stargate 那 5000 亿美元的预算,相对 SpaceX 的发射量级,仍然不够。
那时候的剧本会变成:模型公司必须租 SpaceX 的算力,反过来给云交税。
五、终局:三条可能的路径
现在把镜头拉远,画面就清楚了。AI 价值链未来五到十年大概率会走出三条路径中的某一条——
路径 A:模型公司自建走通。
OpenAI 的 Stargate 项目按预算落地、Anthropic 把 Trainium / TPU 上的训练效率拉到自有水平。GPU 供应链不再卡脖子,电力和土地能拿到。这种情况下,模型公司在前端有用户习惯护城河,在后端有内部化的算力——价值整体流向模型层,云厂沦为标准化的 IaaS 供应商,毛利长期承压。
路径 B:太空算力跑通。
Starship 把发射成本压到 200 美元 / 公斤以下,SpaceX 或后来者的轨道数据中心进入商业化。这一情景下,云重新拥有了模型公司无法复制的物理优势。模型公司必须按使用量给"太空云"交税,价值反向流回云层——更准确地说,流回拥有低成本物理基础设施的玩家。
路径 C:垂直整合者通吃。
SpaceX 收购 xAI,已经把这条路走出来了一截。火箭、卫星、地面网络、芯片、模型,全栈握在一家公司里。如果这家公司既掌握用户感知的"前台"(Grok),又掌握别人复制不出来的"后台"(轨道算力),它的护城河会同时跨过两个维度。
值得注意的是,今天 SpaceX 把 Colossus 1 卖给 Anthropic,而不是优先留给自家 xAI——这个动作本身耐人寻味。它说明 SpaceX 当前阶段更愿意当"算力批发商",先把现金流和数据中心规模撑起来,再用 6 月 IPO 的资金去做轨道部署。这是一个非常老练的资本策略:用模型公司的钱,烧自己的飞船。
三条路径并不互斥,更可能是叠加发生。但只要太空算力这一项哪怕走出 20%,AI 价值链的天平都会从今天的"模型层占优"被重新调整。
六、聊天框背后
回到普通用户那一面。
当一个人打开 Claude 或 ChatGPT,敲下问题、等待回答的时候,他不会知道这条请求最终落在 Memphis 的 Colossus 1,还是 AWS 弗吉尼亚机房的 Trainium2,还是十年后的某颗低轨卫星上。他不会知道这家公司这一年和哪三家云签了多少 GW 长约,也不会知道发射价格降到 200 美元 / 公斤这件事和他每月 20 美元订阅之间的关系。
但他每多用一天 Claude,模型层的护城河就深一寸;模型公司每多签一年长约,云厂的合同覆盖就久一点;SpaceX 每多发一次 Starship,轨道经济的临界点就近一步。
聊天框很安静。聊天框的背后,是一场从消费者注意力,到深海中的光纤,到田纳西的 22 万颗 GPU,再到几百公里高空太阳板的、横跨几个物理尺度的资本和工程战争。
最后的钱会落在哪一层,今天没人知道。但有一件事是确定的——这场仗的胜负,不会在聊天框里见分晓,而会在比聊天框低得多、也高得多的地方决出。
夜雨聆风