4月14日,斯坦福大学以人为本人工智能研究院(HAI)发布了第9期《AI指数报告》,423页。
每年这时候,科技圈都在等这份报告。但今年不一样。报告给出了一个过去两年没人敢断言的结论:中美AI模型性能差距已基本消失。
截至2026年3月,美国顶尖模型仅领先中国模型2.7%。
2.7%。三年前这个数字是300多分。
300分的鸿沟是怎么被填平的
2023年5月,GPT-4-0314在Arena榜单上拿了1320分领跑。中国这边排最前的是ChatGLM-6B,差距超过300分。那时候几乎没人怀疑,美国在AI领域会长期保持压倒性优势。
转折发生在2025年2月。DeepSeek-R1第一次和美国头部模型短暂打平。这是一个信号——差距不是在慢慢缩小,而是在某个节点突然坍缩。
此后一年,中美头部模型在Arena榜单上频繁互换位置。你上个月领先,我这个月反超。到2026年3月,美国的Claude Opus 4.6拿了1503分,中国的dola-seed-2.0-preview拿了1464分,差距39分,换算成百分比2.7%。
全球前十模型里,中国占了四席:阿里、DeepSeek、清华、字节。OpenAI、谷歌、阿里、Anthropic、xAI占据前五。DeepSeek不只是进了前十,它还把开源模型的能力曲线往上推了一大截。
再看价格。中国模型的输出价格大约是美国顶尖模型的十分之一。性能追平,价格打一折,这对全球AI应用市场的冲击,可能比2.7%本身大得多。
2.7%背后:钱在往哪里流
报告的另一组数据,跟2.7%形成了某种讽刺性的对照。
2025年全球企业AI投资达到5817亿美元,同比增长130%。美国独占近一半,私募AI投资2859亿美元。新增AI创业公司1953家,是排名第二国家的10倍以上。
钱在美国这边。美国拥有5427个数据中心,中国449个。算力层面,英伟达占全球60%以上份额,几乎所有芯片代工走台积电。全球AI算力3年涨了30倍,这个基础设施几乎由美国主导。
花钱最多的一方,领先优势只剩2.7%。
还有一个更微妙的数据:进入美国的AI研究人员数量7年来下降了89%,仅过去一年就跌了80%。资金涌入美国,但核心人才资源在反向流动。
锯齿前沿:会做奥数题,看不懂钟表
报告里最值得细读的部分,不是中美差距,而是一个叫"锯齿前沿"的概念。
AI能力的发展极度不均衡。Gemini Deep Think能在国际数学奥林匹克拿金牌,但让它读一个模拟时钟,正确率只有50.1%——跟瞎猜差不多。SWE-bench Verified(真实修Bug基准)一年内从60%飙到接近100%,但机器人在实验室仿真环境操作成功率89.4%,到了真实家庭洗碗叠衣服,暴跌到12%。
网络安全Agent解决问题的成功率从15%涨到93%。可评估科研逻辑的PaperArena测试中,最强AI Agent得分只有39%,大约是博士生水平的一半。
77个百分点的落差。AI不是"变强了",而是在某些方向狂飙突进的同时,另一些方向几乎原地踏步。能拿奥赛金牌的手,翻不开一本日历。这种能力分布,用报告的话说,像锯齿一样参差不齐。
这很重要。因为如果你只看头部能力,会觉得AGI指日可待;如果你只看短板,会觉得AI还是个玩具。真相在中间:AI已经在特定领域达到甚至超越人类专家水平,但在需要常识、灵活性和物理交互的场景中,还差得远。
20%:被精准切除的入门岗位
报告里最让人不舒服的数字,可能不是2.7%,而是20%。
22到25岁的软件开发者,自2024年以来就业人数下降了20%。入门级岗位正在被AI精准替代。
而年长的开发者群体,就业反而在增长。
职业阶梯的第一格断了。没有入门岗位,就没有人能成长为资深工程师。今天砍掉的入门岗位,五年后就是资深人才的缺口。
客服等高AI暴露行业也出现了类似模式。受访企业高管普遍预期,未来裁员幅度会比过去几个月更大。
与此同时,生成式AI的渗透速度前所未有。三年内渗透率达53%,比个人电脑和互联网都快。全球58%的员工在工作中经常使用AI,中国职场AI使用率超过80%。企业采用率88%,五分之四的大学生使用生成式AI。
AI在快速进入工作流,入门岗位同时在消失。这两件事一起发生,才是报告真正该被讨论的地方。
报告没说出口的那句话
这份423页的报告,核心结论可以压缩成一句话:AI的能力在飞速上升,人类管理AI的能力没有跟上。
模型性能在涨,算力在涨,投资在涨,渗透率在涨。但透明度在跌(Foundation Model Transparency Index平均分从58跌到40),人才流入在跌,入门岗位在跌,公众信任在跌。
95个代表性模型中,80个未公开训练代码。谷歌、Anthropic、OpenAI已不再公开最新模型的训练数据规模和时长。
中美差距2.7%,但差距消失不等于竞争结束。美国在资金、算力、顶级模型数量上仍占优势。中国在论文数量、引用次数、专利总量、工业机器人装机量上领先。两国各有长板,这场竞争从"单方面碾压"变成了"你来我往"。
真正该盯着的,不是谁领先2.7%,而是那77个百分点的锯齿落差,和20%消失的入门岗位。一个框定了AI的边界,另一个改写了人的出路。
“ 数据来源:Stanford HAI《AI Index Report 2026》
夜雨聆风