
2026年4月13日,斯坦福HAI发布了第九版《人工智能指数报告》。
这份报告做了9年,是学术界公认最全面的AI年度"体检报告"。各国政府、研究机构、媒体都把它当基准参考。
报告原文几百页,我帮你提炼了6个值得知晓的信息。
信息一:入门岗位的“车门”焊死了
年轻人想上车,太难了
"AI会抢工作"这个话题吵了两年,但一直缺乏硬数据。这份报告给出了具体证据:AI不是抢所有人的工作,而是把"入门"岗位的车门焊死了。
报告证据

斯坦福的经济学家分析了ADP(美国最大薪资服务商)的数百万员工记录,发现:
22到25岁的软件开发者,就业人数从2022年峰值下降了近20% 同期,35岁甚至40岁以上的开发者,数量反而在涨
这不是"年轻人能力不行",而是入门岗位的工作内容——写代码、跑测试、修bug——AI现在都能干,而且干得又快又好。
而那些需要"人味儿"的工作——架构设计、跨团队协调、需求沟通——AI暂时还插不上手。这些恰恰是年长开发者在做的事情。
企业问卷也印证了这点:三分之一的公司预计未来一年会因AI裁员。服务运营、供应链、软件工程,是预期减员最狠的三个领域。
信息二:中美AI差距从"碾压级"变成"毫厘之差"
中国的AI势力真的追上来了
2023年,美国模型领先中国300多分,差距是碾压级的。两年过去,这个差距缩小到可以忽略不计。这个变化速度,超出了几乎所有机构的预测。
报告证据

2023年底,美国模型在各基准测试上的领先幅度:
MMLU:17.5个百分点 HumanEval:31.6个百分点 MATH:24.3个百分点
这个差距,相当于"清华苗子"和"普通一本"的区别。
然后
2025年2月,DeepSeek-R1首次追平美国最强模型,差距只剩0.4%。
2026年3月最新数据:美国Claude Opus 4.6领先中国Dola-Seed 2.0——2.7%。
更有意思的是资金对比:
资金差距从12倍扩大到23倍,技术差距却从两位数缩小到2.7%。说明AI这东西,砸钱的收益已经没那么大了。
信息三:AI能拿IMO金牌,但看不懂表
AI 现在还是天才和低能儿的结合体🐶
这个对比很有意思:AI在竞赛数学上达到金牌水平,但读取时钟信息的正确率只有50.1%(一半一半,等于毫无参考价值)。这个现象揭示了一个关键问题——AI的能力不是"全面超越"或"全面落后",而是参差不齐的"锯齿"状。
报告证据


AI的高光时刻:
SWE-bench(软件工程基准):从2023年的4.4%飙升到接近100% 竞赛数学:可以稳定拿IMO金牌级别的分数 博士级科学问题:和人类专家基本打平 网络安全渗透测试:从15%飙升到93%
AI的"弱智时刻":
读取时钟信息:正确率50.1% 家务机器人:成功率12% 开放世界任务:OSWorld测试成功率约66%
所以AI现在的状态,都不能叫偏科,而是脑子里面就像少了一块。数学卷子能拿满分,但系鞋带能系半小时。
这个现象有个专业名称,叫"能力锯齿前沿"。它提醒我们:不要因为AI在某个领域的突破就以为它"全知全能",也不要因为它在某个领域的拉胯就觉得它"不过如此"。
信息四:模型越强,越不透明
最厉害的喜欢捂着,追赶者靠开源攒人气
按理说,技术越成熟应该越透明。实际情况恰恰相反:最强的模型,往往最不透明。这个趋势对监管、对学术界、对普通用户,都是“坏”消息。
报告证据

头部模型真正开源的越来越少。
基础模型透明度指数的变化:
2023年:37分(刚推出这个指数) 2024年:58分(大家以为春天来了) 2025年:40分(一夜回到解放前)
95个被评估的代表性模型里,80个不公开训练代码。最不透明的,恰恰是OpenAI、Google、Anthropic这些头部玩家。
他们一边发布震惊世界的产品,一边把训练数据来源、训练成本、底层细节捂得严严实实。
背后的逻辑是啥,以前开源让你抄你也抄不会。现在一旦有了参考答案,大家抄得飞快,竞争的壁垒瞬间轰平。
谁还有那么大大方方的开源喃?
信息五:专家乐观,普通人焦虑,年轻人绝望
认知决定情绪,大家对号入座自查
这是个认知的鸿沟:真正懂AI的专家乐观,不懂AI的普通人反而焦虑。这种信息不对称带来的恐惧,可能比AI本身的威胁更可怕。
报告证据

对AI的态度对比:
只有10%的美国人对AI感到兴奋 但73%的AI领域专家认为AI对未来有正面影响
差距最大的问题是就业:73%的专家认为AI会正面影响工作方式,但只有23%的公众这么认为——差了整整50个百分点。
更扎心的是Generation Z(Z世代):
对AI感到兴奋的比例:从2024年的36%跌到22% 希望感:从27%暴跌到18% 愤怒感:从22%飙到31%
44%的Z世代员工甚至承认,曾经故意给公司的AI部署"使绊子"。这不是叛逆,是真的意识到了饭碗不保。
信息六:AI的能源代价惊人
未来有能源就有一切
AI越强,能耗越大。训练一次大模型的碳排放,相当于1.7万辆汽车开一年。这个代价,值得每个关注AI的人了解。
报告证据

几个关键数据:
Grok 4训练一次:排放72,816吨CO2,相当于1.7万辆汽车开一年的排放 全球AI数据中心功率:29.6GW,超过纽约州峰值用电 GPT-4o推理一年的用水量:可能超过1200万人的饮用水需求
与此同时,2025年全球企业AI投资达到5817亿美元,同比暴涨130%。
资本在狂奔,能源在燃烧,“环境”怎么买单谁来买单 变成了个“定时炸弹”。
最后
报告挺长,但这6个信息是我觉得最值得"知晓"的:
入门岗位被 AI 抢占最多 中美差距从碾压级变成毫厘之差 AI能力参差不齐/不全面,不能以一个点断言 AI 的能力 模型越强越不透明 专家乐观,普通人焦虑,年轻人绝望 能源代价惊人
想看原文的,搜"AI Index 2026"就行。
夜雨聆风