马斯克退出AI淘汰赛,软件依然是他的软肋
今天,马斯克宣布xAI解散,并入SpaceX。以后不再有xAI这家公司,只有SpaceXAI——SpaceX旗下的一个AI产品部门。

xAI是马斯克三年前创办的AI公司,做了一个叫Grok的AI模型,目标是正面对抗ChatGPT和Claude。为此他砸下几百亿美元,从最顶级AI公司挖来11位联合创始人,建起了Colossus 1。
这是2024年马斯克在田纳西州孟菲斯建成的超算集群——当时全球最大的单体AI超算中心,22万块英伟达GPU。这种体量的超算中心,行业标准建造周期一般是18到24个月,马斯克仅用了122天。他买下一座废弃的Electrolux工厂改造,租下全美四分之一的移动冷却设备,自建燃气轮机发电绕开电网排队,从第一个机架上架到开始训练只用了19天。当时媒体铺天盖地报道,称之为数据中心行业从未见过的速度,马斯克式奇迹。
现在,Grok彻底失败,这个奇迹超算中心被马斯克转手租给了Anthropic。没错,就是三个月前被他公开在推特上骂”反人类、邪恶”的那家公司。

网上对这件事的解读高度统一:马斯克又下了一盘大棋。有媒体写”釜底抽薪”——一边在法庭上起诉要罢免奥特曼,一边把超算租给OpenAI最大的竞争对手,两面夹击。也有媒体写”一箭三雕”——赚租金、扶持OpenAI的对手、给SpaceX IPO讲故事。评论区清一色在说马斯克是”全场最聪明的人”,解散xAI是主动的战略收缩,不是失败。
AI超维度不这么看。
把时间线摊开,把数据摆出来,这不是什么大棋。马斯克和他的Grok,是AI淘汰赛里第一个被淘汰的。而且这场比赛的残酷程度,远超大多数人的想象。
先看看这场比赛的门槛到底有多高。
训练一个顶级AI模型需要海量算力——几十万块GPU芯片同时运行,耗电量相当于一座中小型城市。行业里用GW(吉瓦)来衡量算力规模,建1 GW大约需要500亿美元。目前OpenAI和Anthropic各自锁定的算力储备都在10 GW左右,相当于各自背后有大约5000亿美元的基础设施在支撑。xAI的Colossus 1是0.3 GW,对手手里的算力是它的三十多倍。而这仅有的0.3 GW,今天还租给了别人。
为什么差距这么大?因为OpenAI和Anthropic自己并不拥有数据中心——它们的算力来自背后的超级云厂商。OpenAI的主要算力供应商是Microsoft和Oracle,Anthropic的是Amazon和Google。这些超级云才是真正的金主。Microsoft、Amazon、Google、Meta、Oracle五家今年在AI基础设施上的资本开支合计接近7000亿美元,平均每天将近20亿美元在建数据中心、买芯片、拉电网。xAI背后没有这样的超级云做靠山,它的资金来源是一轮接一轮的融资——2500亿美元的估值听起来很大,但跟这些每年投入几千亿美元的云巨头比,完全不是一个量级。
人也留不住。2月11号,xAI联合创始人Jimmy Ba离职。他师从Geoffrey Hinton,是Adam优化器论文的联合作者,被引用超过95000次。走之前他负责Grok的训练管线。他不是个例——联创Kyle Kosic更早就走了,直接去了OpenAI。到3月底,11位联合创始人一个不剩。马斯克自己在X上承认:”xAI was not built right first time around”(xAI第一次没建对)。
还有时间差。OpenAI 2015年成立,到今天已经积累了十年的模型研发经验、工程基础设施和开发者生态——ChatGPT的用户基数、API的企业客户、和整个GPT系列模型的迭代积累,都是这十年里一步一步建起来的。Google DeepMind的前身2010年就在做AI研究,比所有人都早。Anthropic 2021年起步,但创始团队直接从OpenAI带走了核心研究经验,等于站在了前人的肩膀上。xAI 2023年才成立——晚了8年、13年、2年。这些年的差距不是钱能弥补的,是模型迭代的经验、训练失败的教训、和开发者信任的积累。后发者要追赶,算力、资金、人才至少得有一样碾压对手。马斯克一样都没有。
5月2号,The Information报了一个数字:xAI的GPU利用率只有11%。
这个数字需要解释一下。GPU利用率衡量的是芯片实际算力输出占理论峰值的比例。11%不是说大部分GPU关着机——xAI的55万块GPU全部通电在运行。问题出在软件层:几十万块芯片要协同工作,数据要在它们之间来回搬运,一块芯片算完了要等其他芯片跟上,训练跑一轮之后研究员要分析结果再决定下一步怎么跑。这些等待和间歇加在一起,实际有效算力只达到理论峰值的11%。行业领先的公司能把这个数字跑到40%以上——这背后靠的不是更好的硬件,而是更成熟的软件调度和工程能力。SpaceX接管xAI之后,星链高级副总裁Nicolls在内部备忘录里的评价只有两个词:embarrassingly low(低得令人尴尬)。
训练这边底层就没跑好,做出来的产品更不用说了。SimilarWeb的全球AI网站流量排名里,Grok份额3.4%——ChatGPT 64.5%,Gemini 21.5%,连DeepSeek都有3.7%。而这3.4%的用户大部分是X导流过来的尝鲜用户,不是主动选择Grok的人。在开发者工具这边更惨:JetBrains调研了一万名开发者,主流AI编程工具是Claude Code、Codex、Cursor等等,Grok甚至都不在名单上。
建超算,马斯克是全世界最快的。但建超算和用好超算是两件事。
马斯克做硬件从来不含糊。SpaceX把火箭发射成本打到了传统航天公司的零头,NASA现在都找他发射。Starlink用几千颗卫星组成星座,让偏远地区也能上网。Tesla从上海超级工厂的建造速度到电池供应链的垂直整合,把造车这件事变成了制造业的教科书。这些事有一个共同点:都是把物理世界的东西造出来、运起来、管起来。

(图:猎鹰9号星链火箭发射)
但一到纯软件产品,情况就不一样了。2022年马斯克花440亿美元收购Twitter,改名X,对平台做了大刀阔斧的改造。结果广告商大批出走,品牌价值持续缩水——软件产品的核心是用户体验和生态,不是工程速度。Grok在开发者生态里的表现也一样:硬件建得全球最快,但产品留不住用户,生态建不起来。
AI竞赛的入场券是硬件,但比赛靠的是软件——模型能力、训练效率、开发者工具、API生态。是让一个程序员在凌晨三点选你而不选别人的那个瞬间。马斯克能122天建好机房,但他建不出那个瞬间。
Grok打不赢,但马斯克手里还有Colossus。模型不行,硬件还在。接下来的问题是怎么处理这些硬件。
答案是:AI比赛,直接退赛,当AI房东。
今年2月13号,Anthropic宣布以3800亿美元估值融资300亿美元。马斯克在这条推下面回了一段话:”Your AI hates Whites & Asians, especially Chinese, heterosexuals and men. This is misanthropic and evil. Fix it.”(你的AI仇恨白人和亚洲人,尤其是中国人、异性恋者和男性。这是反人类的,是邪恶的。改掉。)他还嘲讽Anthropic的名字注定会变成Misanthropic(反人类的),说”你们取名字的那天就注定了这个命运”。

三个月后的今天,马斯克又发了一条推。这次口气完全不一样了:”上周我花了很多时间与Anthropic团队的高级成员交流,以了解他们为确保Claude对人类有益所做的工作,我对此印象深刻。我遇到的每个人都非常称职,并且非常关心做正确的事情。没有人触发了我的’邪恶探测器’。”然后他宣布:同意将Colossus 1租给Anthropic。

从”邪恶”到”称职”,从攻击到合作,中间只隔了三个月。这三个月里变的不是Anthropic——变的是马斯克自己的处境。Grok打不赢,团队散了,GPU在空转。骂归骂,生意归生意。
马斯克出局了。但这个故事真正值得关注的不是他,而是这场比赛本身的残酷性。
全球首富级别的资金、122天建超算的工程能力、从DeepMind和OpenAI挖来的创始团队——这些条件放在任何其他行业都是碾压级的。在AI这里,不够。
那其他玩家呢?
美国这边,Llama有Meta的16.8 GW数据中心和无限资金,但至今没有找到商业化路径,更像是Meta的防守工具而不是一个独立产品。Mistral在欧洲有GDPR合规的独占位,但规模和资金跟前三名差了一个数量级。
中国这边,牌桌上还坐着七八家:智谱、Kimi、阿里、字节、DeepSeek、MiniMax,百度、腾讯也在,但已经有些掉队。它们面对的局面比马斯克更难——算力受限于芯片管制,资金体量跟美国超级云不在一个量级。DeepSeek刚刚启动了第一轮融资,这本身就说明光靠自有资金已经扛不住了。
马斯克是第一个出局的。
下一个是谁?
–END–
关注我,获取更多AI非共识!
夜雨聆风