马斯克退出AI淘汰赛,软件依然是他的软肋-夜雨聆风

马斯克退出AI淘汰赛,软件依然是他的软肋

今天，马斯克宣布xAI解散，并入SpaceX。以后不再有xAI这家公司，只有SpaceXAI——SpaceX旗下的一个AI产品部门。

xAI是马斯克三年前创办的AI公司，做了一个叫Grok的AI模型，目标是正面对抗ChatGPT和Claude。为此他砸下几百亿美元，从最顶级AI公司挖来11位联合创始人，建起了Colossus 1。

这是2024年马斯克在田纳西州孟菲斯建成的超算集群——当时全球最大的单体AI超算中心，22万块英伟达GPU。这种体量的超算中心，行业标准建造周期一般是18到24个月，马斯克仅用了122天。他买下一座废弃的Electrolux工厂改造，租下全美四分之一的移动冷却设备，自建燃气轮机发电绕开电网排队，从第一个机架上架到开始训练只用了19天。当时媒体铺天盖地报道，称之为数据中心行业从未见过的速度，马斯克式奇迹。

现在，Grok彻底失败，这个奇迹超算中心被马斯克转手租给了Anthropic。没错，就是三个月前被他公开在推特上骂”反人类、邪恶”的那家公司。

网上对这件事的解读高度统一：马斯克又下了一盘大棋。有媒体写”釜底抽薪”——一边在法庭上起诉要罢免奥特曼，一边把超算租给OpenAI最大的竞争对手，两面夹击。也有媒体写”一箭三雕”——赚租金、扶持OpenAI的对手、给SpaceX IPO讲故事。评论区清一色在说马斯克是”全场最聪明的人”，解散xAI是主动的战略收缩，不是失败。

AI超维度不这么看。

把时间线摊开，把数据摆出来，这不是什么大棋。马斯克和他的Grok，是AI淘汰赛里第一个被淘汰的。而且这场比赛的残酷程度，远超大多数人的想象。

先看看这场比赛的门槛到底有多高。

训练一个顶级AI模型需要海量算力——几十万块GPU芯片同时运行，耗电量相当于一座中小型城市。行业里用GW（吉瓦）来衡量算力规模，建1 GW大约需要500亿美元。目前OpenAI和Anthropic各自锁定的算力储备都在10 GW左右，相当于各自背后有大约5000亿美元的基础设施在支撑。xAI的Colossus 1是0.3 GW，对手手里的算力是它的三十多倍。而这仅有的0.3 GW，今天还租给了别人。

为什么差距这么大？因为OpenAI和Anthropic自己并不拥有数据中心——它们的算力来自背后的超级云厂商。OpenAI的主要算力供应商是Microsoft和Oracle，Anthropic的是Amazon和Google。这些超级云才是真正的金主。Microsoft、Amazon、Google、Meta、Oracle五家今年在AI基础设施上的资本开支合计接近7000亿美元，平均每天将近20亿美元在建数据中心、买芯片、拉电网。xAI背后没有这样的超级云做靠山，它的资金来源是一轮接一轮的融资——2500亿美元的估值听起来很大，但跟这些每年投入几千亿美元的云巨头比，完全不是一个量级。

人也留不住。2月11号，xAI联合创始人Jimmy Ba离职。他师从Geoffrey Hinton，是Adam优化器论文的联合作者，被引用超过95000次。走之前他负责Grok的训练管线。他不是个例——联创Kyle Kosic更早就走了，直接去了OpenAI。到3月底，11位联合创始人一个不剩。马斯克自己在X上承认：”xAI was not built right first time around”（xAI第一次没建对）。

还有时间差。OpenAI 2015年成立，到今天已经积累了十年的模型研发经验、工程基础设施和开发者生态——ChatGPT的用户基数、API的企业客户、和整个GPT系列模型的迭代积累，都是这十年里一步一步建起来的。Google DeepMind的前身2010年就在做AI研究，比所有人都早。Anthropic 2021年起步，但创始团队直接从OpenAI带走了核心研究经验，等于站在了前人的肩膀上。xAI 2023年才成立——晚了8年、13年、2年。这些年的差距不是钱能弥补的，是模型迭代的经验、训练失败的教训、和开发者信任的积累。后发者要追赶，算力、资金、人才至少得有一样碾压对手。马斯克一样都没有。

5月2号，The Information报了一个数字：xAI的GPU利用率只有11%。

这个数字需要解释一下。GPU利用率衡量的是芯片实际算力输出占理论峰值的比例。11%不是说大部分GPU关着机——xAI的55万块GPU全部通电在运行。问题出在软件层：几十万块芯片要协同工作，数据要在它们之间来回搬运，一块芯片算完了要等其他芯片跟上，训练跑一轮之后研究员要分析结果再决定下一步怎么跑。这些等待和间歇加在一起，实际有效算力只达到理论峰值的11%。行业领先的公司能把这个数字跑到40%以上——这背后靠的不是更好的硬件，而是更成熟的软件调度和工程能力。SpaceX接管xAI之后，星链高级副总裁Nicolls在内部备忘录里的评价只有两个词：embarrassingly low（低得令人尴尬）。

训练这边底层就没跑好，做出来的产品更不用说了。SimilarWeb的全球AI网站流量排名里，Grok份额3.4%——ChatGPT 64.5%，Gemini 21.5%，连DeepSeek都有3.7%。而这3.4%的用户大部分是X导流过来的尝鲜用户，不是主动选择Grok的人。在开发者工具这边更惨：JetBrains调研了一万名开发者，主流AI编程工具是Claude Code、Codex、Cursor等等，Grok甚至都不在名单上。

建超算，马斯克是全世界最快的。但建超算和用好超算是两件事。

马斯克做硬件从来不含糊。SpaceX把火箭发射成本打到了传统航天公司的零头，NASA现在都找他发射。Starlink用几千颗卫星组成星座，让偏远地区也能上网。Tesla从上海超级工厂的建造速度到电池供应链的垂直整合，把造车这件事变成了制造业的教科书。这些事有一个共同点：都是把物理世界的东西造出来、运起来、管起来。

（图：猎鹰9号星链火箭发射）

但一到纯软件产品，情况就不一样了。2022年马斯克花440亿美元收购Twitter，改名X，对平台做了大刀阔斧的改造。结果广告商大批出走，品牌价值持续缩水——软件产品的核心是用户体验和生态，不是工程速度。Grok在开发者生态里的表现也一样：硬件建得全球最快，但产品留不住用户，生态建不起来。

AI竞赛的入场券是硬件，但比赛靠的是软件——模型能力、训练效率、开发者工具、API生态。是让一个程序员在凌晨三点选你而不选别人的那个瞬间。马斯克能122天建好机房，但他建不出那个瞬间。

Grok打不赢，但马斯克手里还有Colossus。模型不行，硬件还在。接下来的问题是怎么处理这些硬件。

答案是：AI比赛，直接退赛，当AI房东。

今年2月13号，Anthropic宣布以3800亿美元估值融资300亿美元。马斯克在这条推下面回了一段话：”Your AI hates Whites & Asians, especially Chinese, heterosexuals and men. This is misanthropic and evil. Fix it.”（你的AI仇恨白人和亚洲人，尤其是中国人、异性恋者和男性。这是反人类的，是邪恶的。改掉。）他还嘲讽Anthropic的名字注定会变成Misanthropic（反人类的），说”你们取名字的那天就注定了这个命运”。

三个月后的今天，马斯克又发了一条推。这次口气完全不一样了：”上周我花了很多时间与Anthropic团队的高级成员交流，以了解他们为确保Claude对人类有益所做的工作，我对此印象深刻。我遇到的每个人都非常称职，并且非常关心做正确的事情。没有人触发了我的’邪恶探测器’。”然后他宣布：同意将Colossus 1租给Anthropic。

从”邪恶”到”称职”，从攻击到合作，中间只隔了三个月。这三个月里变的不是Anthropic——变的是马斯克自己的处境。Grok打不赢，团队散了，GPU在空转。骂归骂，生意归生意。

马斯克出局了。但这个故事真正值得关注的不是他，而是这场比赛本身的残酷性。

全球首富级别的资金、122天建超算的工程能力、从DeepMind和OpenAI挖来的创始团队——这些条件放在任何其他行业都是碾压级的。在AI这里，不够。

那其他玩家呢？

美国这边，Llama有Meta的16.8 GW数据中心和无限资金，但至今没有找到商业化路径，更像是Meta的防守工具而不是一个独立产品。Mistral在欧洲有GDPR合规的独占位，但规模和资金跟前三名差了一个数量级。

中国这边，牌桌上还坐着七八家：智谱、Kimi、阿里、字节、DeepSeek、MiniMax，百度、腾讯也在，但已经有些掉队。它们面对的局面比马斯克更难——算力受限于芯片管制，资金体量跟美国超级云不在一个量级。DeepSeek刚刚启动了第一轮融资，这本身就说明光靠自有资金已经扛不住了。

马斯克是第一个出局的。

下一个是谁？

–END–

关注我，获取更多AI非共识！