马斯克说明年Q1,唐杰说不用那么久:一场关于中国AI的大佬隔空对话
事情是怎么开始的
6月18日,X上有人问了一个问题。
问题很简单:中国大模型什么时候能达到Fable 5的水平?GLM-5.2肯定缩短了差距,但到底还要多久?
这个问题像一根火柴,点着了一串炸药。
先是技术圈KOL Teortaxes出手,接着马斯克亲自下场,最后智谱创始人唐杰一句轻描淡写,把整个对话推向了高潮。
Teortaxes:7个月,这是数学算出来的
Teortaxes,65K粉丝的AI技术博主,每次对DeepSeek的技术解读都相当到位。这次他拿出了推算逻辑。
他先给GLM-5.2定了个位:目前大概是Claude Opus 4.7到4.8的水平。视觉理解部分另算,因为智谱暂时做不到全模态统一。当然他也补了一句:Opus在视觉理解上本身也很烂。
由此推断,中美模型之间现在存在7个月的时间差。
他的推算参照点是Mythos模型:Mythos系列在2026年2月初达到Preview级别,功能上追平或超过Opus 4.8。按这个时间线推算,中国若要出一个能力对标Mythos完整版的模型,时间大概落在2026年11月到12月。
7个月,这是他的答案。不是拍脑袋,是拿已有模型迭代速度推算出来的。
马斯克:可能在2027年Q1
马斯克来了。Teortaxes推算7个月,马斯克加了一个季度。
他的原话是:可能在2027年第一季度。
但他没停在7个月还是10个月的争论上。他补了一句更重要的:在基准测试上追赶相对容易,但以真实实用性衡量,明年Q1也已经相当出色。
这句话藏着两层意思。
第一层:benchmark追平不等于实际能力追平。跑分好看和真正好用之间,有鸿沟。
第二层:他承认了中国模型的追赶速度比他预期的快。明年Q1就已经相当出色——这从马斯克嘴里说出来,分量不轻。
别忘了,马斯克自己有xAI,有Grok。他不是旁观者,他是竞争者。竞争者承认对手进步快,比旁观者夸一百句都有说服力。
唐杰:不需要那么久
唐杰只说了五个字。
不需要那么久。
没有长篇论证,没有数据图表,没有PPT。五个字,轻描淡写,但信息量巨大。
这不是吹牛。唐杰是智谱首席科学家,清华教授,ACM Fellow。他比任何人都清楚GLM-5.2的真正水平,也比任何人都清楚下一代模型的技术路线和时间表。
据媒体报道,唐杰暗示以智谱为代表的国内大模型有望在今年内实现跨越。要达成这个目标,不仅要在预训练阶段把模型推向万亿级参数,还要在后训练阶段让模型能够部分跑通自我训练。
万亿级参数+自我训练,这两件事如果今年做成,7个月的差距就不再是差距了。
唐杰的底气从哪来?从GLM-5.2的Code Arena全球第一来。从8家国产芯片Day 0适配来。从MIT协议开放给全世界来。这些东西已经落地了,不是画饼。
为什么7个月这个数字本身就不靠谱
7个月是怎么算出来的?拿Mythos的发布时间做参照,减去GLM-5.2的发布时间,得出时间差,再线性外推。
问题在于,模型迭代不是线性函数。
第一,Fable 5被美国政府下架了。这意味着海外开发者被迫转向国产模型,用户反馈和数据飞轮会加速国产模型的迭代。这条加速曲线,Teortaxes没算进去。
第二,开源本身就在压缩时间差。GLM-5.2是MIT协议开源的,全球开发者都能用、都能改、都能提issue。每一次外部贡献,都是在缩短差距。这不是一家公司闭门造车,是全世界一起帮你追。
第三,算力瓶颈在松动。华为昇腾950下半年上市,8家国产芯片已经Day 0适配。算力不够快这个最大瓶颈,正在被逐步解决。
所以7个月可能是上限,不是下限。
马斯克真正想说的是什么
回到马斯克那句补充:在基准测试上追赶相对容易,但以真实实用性衡量,明年Q1也已经相当出色。
这句话翻译成人话:跑分会追平,但好不好用是另一回事。
他说的有没有道理?有。benchmark测的是特定场景的特定能力,真实世界的问题比benchmark复杂得多。模型能不能理解上下文之外的用户意图?能不能在长程任务中不出错?能不能在不确定性面前做出合理判断?这些是benchmark测不出来的。
但他的说法也忽略了一件事:中国开发者正在用GLM-5.2做真实世界的事情。不是跑分,是写代码、做重构、分析遗留系统、跑完整工程。Code Arena的盲测就是真实世界的压力测试,不是刷题。
马斯克强调真实实用性,但Code Arena本身就是真实实用性的验证场。GLM-5.2在那个场上拿了全球可用模型第一。这个事实,比任何benchmark分数都硬。
这场对话真正该关注的三个信号
信号一:大佬们讨论的不再是能不能追上,而是什么时候追上。
这个前提本身就是巨变。一年前,讨论的焦点是中国大模型能不能缩小差距。现在,差距已经被默认存在但可追平,问题只剩时间。从能不能到什么时候,这是质变。
信号二:竞争者比旁观者更诚实。
马斯克明年Q1的判断,比很多国内媒体乐观得多。他有xAI,有Grok,有Grok-3在跑。他说明年Q1相当出色,是因为他看到了对手的进步速度,不是因为他想夸你。
信号三:开源正在改写游戏规则。
Fable 5被下架的同一天,GLM-5.2开源了。海外开发者不需要等马斯克的预测成真,今天就能下载权重、自己跑推理、自己验证。开源不是慈善,是战略武器。每一次封锁,都是在给开源递弹药。
尾声:7个月后见分晓
7个月,2026年11月到12月。这是Teortaxes的推算。
10个月,2027年Q1。这是马斯克的判断。
不用那么久。这是唐杰的回应。
三个答案,三种立场:技术KOL的理性推算、竞争者的谨慎评估、当事人的自信押注。
谁对谁错,7个月后见分晓。
但我倾向相信唐杰。不是因为他最乐观,而是因为他是唯一一个手里有货的人。GLM-5.2已经开源了,Code Arena已经全球第一了,8家国产芯片已经Day 0适配了。他不是在预测未来,他是在预告已经排好期的产品。
至于马斯克说的真实实用性——一个被美国政府紧急下架的模型,和一个主动开源给全世界的模型,哪个更有真实实用性?
答案不需要7个月。今天就能回答。
夜雨聆风