今天,斯坦福大学人类中心 AI 研究所(Stanford HAI)发布了第 9 年的 AI Index 年度报告。这份超过 400 页的报告,是全球 AI 行业最权威的"年度体检报告",覆盖技术性能、投资趋势、人才市场、公众态度、环境影响等所有关键维度。
一句话总结今年的核心结论:中美 AI 差距被抹平了,但代价正在显现。
今天我帮你拆解报告里最值得关注的 7 个发现,看完你就能跟任何人聊清楚"AI 现在到底发展到什么程度了"。
发现一:中美 AI 差距,从"领先一个身位"变成"齐头并进"
这是今年报告最炸裂的结论。
根据社区驱动的模型排名平台 Arena 的数据,美国和中国的 AI 模型性能差距已经几乎为零。两国的模型在排行榜上你追我赶,交替占据第一。
回顾一下时间线:
- 2023 年初
:OpenAI 的 ChatGPT 独领风骚,美国大幅领先 - 2024 年
:Google 和 Anthropic 发力,但中国模型还有明显差距 - 2025 年 2 月
:DeepSeek R1 横空出世,短暂追平美国最强模型 - 2026 年 3 月
:Anthropic、xAI、Google、OpenAI 混战,中国的 DeepSeek 和阿里巴巴紧随其后,差距只剩毫厘
但中美各有优势:
🇺🇸 美国:模型数量更多(50 个"重要模型" vs 中国的 15 个)、资本更强、数据中心 5427 个(是其他国家的 10 倍以上) 🇨🇳 中国:AI 论文数量全球第一、专利全球第一、工业机器人安装量全球第一(29.5 万台,美国只有 3.4 万台)
跟普通人有什么关系? 中美齐头并进意味着竞争更激烈,对用户来说是好事——产品迭代更快,价格战会让 AI 工具更便宜。但也意味着 AI 人才竞争白热化,想进这个行业的窗口期正在收窄。
发现二:AI 普及速度,超过了 PC 和互联网
一个让人震惊的数字:全球 53% 的人口已经在定期使用生成式 AI。
这是什么概念?个人电脑花了 15 年才达到这个渗透率,互联网花了 10 年,智能手机花了 7 年。生成式 AI 用了大概 3 年。
但使用率的地区差异很大:
- 中国、马来西亚、泰国、印尼、新加坡
:超过 80% 的人预期 AI 将深刻影响生活 - 美国
:只有 28.3% 的人在定期使用生成式 AI,全球排第 24 名
这个反差很有意思——美国人开发了最强的 AI,但用的人比例并不高。反而是东南亚和中国用户更积极地拥抱这项技术。
跟普通人有什么关系? 如果你现在还没用过 ChatGPT、通义千问或者 DeepSeek,你已经在全球平均水平之后了。不是说必须用,而是了解一下,可能发现它真的能帮你省时间。
发现三:AI 投资炸了,但钱都烧在了基础设施上
2025 年全球 AI 投资总额达到 5810 亿美元,是 2024 年(2530 亿美元)的两倍多。自 2013 年以来,AI 投资翻了 40 倍。
钱花到哪里了?主要是数据中心和芯片。
一个关键数据:全球 AI 算力容量自 2022 年以来每年增长 3.3 倍,总量已经翻了 30 倍。Nvidia 的 GPU 占了全球 AI 算力的 60% 以上。
但同时,AI 公司仍然在亏损。OpenAI 年亏 140 亿美元,Anthropic 在疯狂融资,整个行业的模式是"先烧钱抢地盘,后面再想怎么赚"。
跟普通人有什么关系? 你可能觉得这些天文数字跟自己没关系,但这些投资最终会变成两件事:一是你用的 AI 工具变得更强(因为有更多算力训练更好的模型);二是电费和水费账单可能会涨(数据中心要用大量电和水,下面会讲)。
发现四:AI 的环境成本,已经到了触目惊心的地步
这是今年报告最让人不安的部分。
几个数据:
🔥 训练 xAI 的 Grok 4 模型,产生了超过 7.2 万吨碳排放。 作为对比,GPT-4 大约 5184 吨,Llama 3.1 大约 8930 吨。独立机构 Epoch AI 估计 Grok 4 的真实排放可能高达 14 万吨。 💧 GPT-4o 的推理用水量,够 1200 万人喝。 是的,你没看错。 ⚡ 全球 AI 数据中心总用电量达到 29.6 吉瓦。 这是什么概念?够整个纽约州在用电高峰时使用。
不同模型的能效差异也很大。推理效率最差的模型耗能是最好的 10 倍以上。DeepSeek V3 回答一个中等长度的问题大约消耗 23 瓦,而 Claude 4 Opus 只需要约 5 瓦。
跟普通人有什么关系? 每次你用 AI 生成一张图片、写一段文字,背后都在消耗电力和水。当然单次使用的消耗微乎其微,但乘以几十亿用户就是天文数字。选择更高效的模型,也算是一种"低碳生活"。
发现五:AI 越来越强了,但依然"偏科严重"
好消息:AI 模型在很多基准测试上已经达到或超过人类专家水平,包括 PhD 级别的科学、数学和语言理解。软件工程基准 SWE-bench 的最高分从 2024 年的 60% 飙升到 2025 年的接近 100%。
坏消息:AI 仍然有一些"死穴"。
最典型的例子——读钟表。ClockBench 测试发现,表现最好的 GPT-5.4 读对模拟时钟的概率只有 50%(跟扔硬币差不多)。Claude Opus 4.6 更离谱,准确率只有 8.9%。
这是因为 AI 模型是通过处理大量文字和图像来学习的,而不是通过真实世界的体验。所以它们展现出的是一种"参差不齐的智能"——能做最难的物理题,但可能看不懂一个时钟。
机器人方面也是如此:人形机器人目前只能完成 12% 的家务任务。
跟普通人有什么关系? 不要迷信 AI,也不要完全否定它。它在有些领域已经超越人类,但在另一些"常识性"任务上依然很蠢。关键是知道它擅长什么、不擅长什么,然后把它放在合适的位置。
发现六:透明度创新低,公众信任也在走低
一个令人担忧的趋势:超过 90% 的重要 AI 模型由私营公司开发,透明度持续下降。
Google、Anthropic、OpenAI 都已经不再公开新模型的数据集大小和训练时长。2025 年发布的 95 个最重要模型中,有 80 个没有公开训练代码。
与此同时,AI 公司在政治上的影响力在扩大——在美国国会 AI 相关听证会上,行业代表的占比自 2017 年以来翻了 3 倍,而中立学者的比例大幅下降。
公众对 AI 的信任也在走低:
🇺🇸 美国:只有 31% 的公民信任政府能正确监管 AI 🇨🇳 中国:27%(全球最低) 🇪🇺 欧盟:53%(相对乐观)
跟普通人有什么关系? 你用的 AI 产品,你其实不知道它是怎么训练出来的、用了什么数据。这不是你的错,是整个行业在变得更不透明。作为用户,至少可以做到:对 AI 输出保持怀疑,重要决策不完全依赖 AI。
发现七:AI 对就业的影响,已经开始显现
报告指出了一个重要的"认知鸿沟":
- 73% 的 AI 专家
对 AI 对就业的影响持乐观态度 - 只有 23% 的普通公众
持同样看法
而数据似乎站在公众这边——报告首次发现,"AI 暴露行业"的年轻工人就业率已经开始下降。
但也有好消息。多项研究表明,AI 不仅提高了生产力,在大多数情况下还缩小了劳动力市场的技能差距。换句话说,AI 让"不太熟练的人"也能做到"熟练人"的水平。
美国一半的上班族已经在工作中使用 AI(据 Gallup 最新调查,首次达到 50%)。但管理层和普通员工对 AI 的态度有明显分裂——老板们普遍更乐观。
跟普通人有什么关系? AI 不会直接"抢走"你的工作,但会改变你的工作内容。最务实的做法不是焦虑,而是学会用 AI 来提升自己的效率。这正是我们这个系列一直在教的事情。
一张表看懂报告核心数据
我的观点
斯坦福的报告非常克制,只摆数据不下结论。但如果让我提炼三个最重要的信号:
第一,"AI 寒冬"不会来。 投资翻倍、普及率破 50%、模型性能持续爆发——无论怎么看,AI 都处在加速期而非放缓期。
第二,"免费午餐"正在结束。 AI 的环境成本已经大到无法忽视。随着监管加强和公众意识提高,更高效、更环保的模型会获得竞争优势。
第三,"用不用 AI"已经不是个选择题了。 53% 的全球人口在用、50% 的美国上班族在用——如果你还在观望,现在就是最好的开始时间。
报告原文链接: hai.stanford.edu/ai-index/2026-ai-index-report
来源: Stanford HAI(来源:SiliconANGLE, 2026-04-13)、IEEE Spectrum(来源:IEEE Spectrum, 2026-04-13)、MIT Technology Review(来源:MIT Technology Review, 2026-04-13)
关注「AI引路者」,每天用大白话帮你搞懂 AI。看完就能用。
夜雨聆风