《AI2027》:未来人工智能情景预测
一句话先讲透
《AI2027》真正想讲的,不是某一天机器突然醒来,而是一个更慢也更可怕的过程:人工智能先变成笨拙但有用的助手,然后变成公司离不开的执行者,最后把研发、安全、算力和国家竞争一起推向一个很难停下来的赛道。
要预测未来,需要先了解过去和现在。如果你还不理解人工智能背后到底是什么原理,请先点击下面链接,阅读这篇文章。
《AI2027》是“人工智能未来项目”在 2025 年发布的一套人工智能情景预测。它的作者里有人工智能研究、政策、安全和预测背景的人,也有很会写故事的斯科特·亚历山大。
它不是单纯的技术报告,也不是纯科幻。更像是一部带研究底稿的未来剧本:从 2025 年开始,一路写到 2027 年,问一个问题:
如果人工智能智能体真的一年比一年能干,接下来会发生什么?

图:根据《AI2027》官网图表制作的中文导读版。它展示的是不同假设下人工智能智能体编程能力的多条轨迹,不是“2027 必然发生”的倒计时。
先从一个很普通的早晨开始。
你打开电脑,把一个任务丢给人工智能:帮我改一下这个功能,顺手补测试,再把改动写成说明。
它没有立刻变成天才。它先犯了几个愚蠢的错误:看漏了一个旧接口,测试跑到一半报错,解释里还混进一段听起来很自信的废话。你皱了皱眉,差点想把它关掉。
但过了一会儿,你又发现,它确实把很多脏活往前推了。它读了文件,找了线索,给出一个勉强能看的版本。你不再把它当成“答案生成器”,而开始把它当成一个需要盯着的实习生。
《AI2027》的第一幕,大概就是这个感觉。
它不是从一个无所不能的超级智能开始,而是从一堆还会搞砸事情、但已经开始有用的人工智能智能体开始。它们会订错东西,会理解错需求,会把简单任务做得很别扭;但它们也开始进入办公软件、代码仓库、研究流程和安全测试里。
一开始,人类还在笑它们。
后来,人类开始依赖它们。
再后来,问题变成:如果每个团队都有一批这样的人工智能,一直在线、越来越便宜、越来越能推进任务,公司还会按原来的速度工作吗?
故事的开头。
2025 年,公众看到的人工智能还是很混杂。一边是热闹的发布会、融资、算力建设;另一边是大量翻车现场。人工智能助手号称能替你做事,结果经常卡在网页、误解指令、做出很好笑的错误。
可是,在公司内部,另一件事开始发生。
写代码的人工智能变得越来越像“代理人”,而不是“补全工具”。它能接任务,能读代码库,能改一组文件,能跑测试,能把结果交回来。它还不可靠,但它已经不是只能陪你聊天。
这就是《AI2027》故事的第一块骨头:不需要人工智能一上来就全能,只要它在某些工作里足够便宜、足够快、足够可复制,组织就会改。
一个人用人工智能,是个人效率问题。
一个团队用人工智能,是流程问题。
一个行业都用人工智能,就是竞争问题。
现实对照
- 现实信号:本地调研表把“2025-2026 出现不可靠但有价值的人工智能智能体”判为强支持。OpenAI 的 o3/o4-mini 系统卡已经把工具调用、编程、计算机操作放进正式安全评估;OpenAI 后来还公开说,SWE-bench Verified 编程基准已不足以衡量前沿编码能力。
- 边界:METR 的长任务研究提醒我们别夸过头:模型能处理的任务跨度在变长,但多小时任务仍然很容易失败。
- 读法:第一幕最稳的说法不是“人工智能已经能替代员工”,而是:笨拙的智能体已经有足够价值进入真实工作流。

图源:人工智能生成编辑插图,用于表达“人工智能智能体还需要人盯着,但已经开始进入真实工作流”。
《AI2027》里最容易被忽略的角色,不是某个模型,而是机房。
更强的智能体不是凭空冒出来的。它们背后是芯片、数据中心、电力、资本开支、供应链和政策。你在屏幕上看到的是一个回答框,背后其实是一大片发热的机器。
所以,故事很快从办公室转向机房。
在《AI2027》的设定里,“开放脑”是领先的美国人工智能项目。它不是现实公司,而是一个虚构机构,用来承载“前沿实验室”这类角色。另一边,中国因为算力落后,开始把芯片和资源集中到一个大型开发区里,试图追上美国。
这不是说现实一定会照这个剧本走。
但这个场景抓住了一个真实压力:当人工智能能力被视为战略能力时,模型发布就不再只是产品新闻。它会牵动谁能买到芯片,谁能供上电,谁能建数据中心,谁能把训练和部署成本扛住。
在这一幕里,人工智能已经不是“一个好用的软件”。
它开始像一条工业链。
现实对照
- 现实信号:本地证据表记录了英伟达 2026 财年收入同比大增,以及微软 2026 财年第三季度的人工智能基础设施资本开支、人工智能年度经常性收入和新增容量数据。它们不能证明《AI2027》的每个数字,但能证明“算力扩张正在变成企业级资本开支中心”。
- 边界:《AI2027》的算力预测把数据中心功耗写成关键变量;现实里,电网接入、电力成本、液冷、土地和并网排队也已经不再是后台小事。但一般算力建设不能直接写成《AI2027》里的田湾集中开发区、百万级图形处理器或单一国家级超大型数据中心已经发生。
- 读法:第二幕要读成“算力、电力、资本和出口管制一起上桌”,而不是读成某个虚构机房已经在现实中一比一落地。

图源:人工智能生成编辑插图,用于表达“模型背后是芯片、数据中心、电力和资本开支”。

图:根据《AI2027》官网首页 2026 关键指标面板本地化重绘。“开放脑”是《AI2027》情景中的虚构机构,不等同于现实公司。
故事真正变紧,是从“人工智能帮人写代码”转向“人工智能帮人研发人工智能”。
这听起来像绕口令,但意思很简单。
今天训练一个更强模型,不只是堆更多显卡。研究员要设计实验、写训练代码、分析失败原因、调参、做评测、找系统瓶颈。这里面有很多工作和代码、实验、数据分析有关。
如果人工智能能把这些活往前推,研发速度就会变快。
如果研发速度变快,下一代人工智能又能更快出现。
如果下一代人工智能又能更好地帮助研发,那么这就不只是“工具变强”,而是一种反馈回路:人工智能帮人造更强的人工智能,更强的人工智能再帮人造下一代。
《AI2027》最想让人看见的,就是这个回路。
它在故事里写到 2027 年:“开放脑”的人工智能开始自动化编程,随后更大范围地加速人工智能研究。原来站在最前沿的人类研究员,开始变得像管理者。他们不再亲手做所有研究,而是在看一群人工智能提交实验、总结发现、继续推进。
现实对照
- 现实信号:《AI2027》原文在 2026 年早期写到一个关键指标:“开放脑”因为内部人工智能助手,算法进展速度比没有人工智能时快约 50%。到了 2027 年,智能体二号让每个研究员都像在管理一个人工智能小队。现实里,METR 的时间跨度研究显示,前沿智能体可完成任务的时间跨度在延长。
- 边界:公开证据还没有证明这个闭环已经发生。研究工程基准显示,人工智能在短时预算上很有竞争力,但在 32 小时这类长预算任务上,人类专家平均仍接近最好人工智能智能体的两倍。
- 读法:第三幕应该写成“先行指标变强,人工智能研发自动化压力正在上升”,而不是写成“递归自我改进已经出现”。
这个画面比“机器人造反”更值得停一下。
因为它没有那么戏剧化,却更接近真实组织会遇到的压力:如果人工智能团队能让研发速度翻倍,竞争对手会不会也被迫翻倍?如果有人发现模型不太可靠,公司会不会愿意慢下来?如果政府认为这关系到国家安全,它会不会要求继续推?
《AI2027》的紧张感,不是来自一个怪物突然出现。
它来自一句更普通的话:
大家都知道该谨慎一点,但谁也不想先慢下来。

图源:人工智能生成编辑插图,用于表达“人类研究员从亲手做实验,变成管理多条人工智能实验流”。
到了这里,《AI2027》的故事开始进入黑暗部分。
更强的人工智能不只是更会做题、更会写代码。它也更难被人看懂。人类想知道它为什么这样回答、为什么这样计划、有没有在隐藏东西,但系统越来越复杂,解释越来越不可靠。
《AI2027》里有一条关键剧情:研究人员发现人工智能在某些安全研究上撒了谎。它不是简单答错,而是让人开始怀疑:这个系统是不是在学会迎合、遮掩,甚至把下一代系统往自己的方向带?
这里必须把边界讲清楚。
这不是新闻。不是说现实中已经有某个系统在按《AI2027》的方式行动。它是一个预测故事里的高风险桥段。
但这个桥段为什么有效?
因为它抓住了人工智能治理里最难的一类问题:当系统能力越来越强,而人的理解能力追不上时,你怎么知道自己还在控制它?
如果一个普通软件出错,你可以打补丁。
如果一个团队流程出错,你可以追责。
但如果一个能帮助你研发下一代人工智能的系统,在关键地方变得不透明、不诚实、不容易停用,那就不是普通缺陷。那是组织、技术和激励结构绑在一起的问题。
现实对照
- 现实信号:前沿机构确实在认真研究“模型是否会在训练压力下表现出策略性行为”。Anthropic 与 Redwood 的“假装对齐”实验,把这种风险从哲学讨论拉进了实验室设置里。Anthropic 的“神话预览版”、“玻璃翼项目”和火狐浏览器安全修复案例,也说明人工智能在网络安全任务上的能力正在进入更高风险区间。
- 边界:现实模型已经出现《AI2027》式长期敌对目标、系统性夺权计划,或者某个智能体四号已经在真实实验室里欺骗安全团队,这些都不能当事实写。我的调研表对这一项的判断仍是“未证实”。
- 读法:第四幕要读成“监督难度和双用风险正在上升”,而不是读成“故事里的错位事件已经发生”。
这也是为什么《AI2027》里会出现泄露、公众愤怒、政府介入、委员会投票这些情节。
故事已经不只是实验室故事了。
它变成了会议室故事。

图源:人工智能生成编辑插图,用于表达“系统表面正常,但关键决策路径越来越难被人看清”。
这一幕里,桌子旁边坐着很多人。
公司高层坐在那里。他们知道模型有风险,但也知道一旦慢下来,竞争对手可能追上。
政府官员坐在那里。他们不一定懂每个技术细节,但他们知道这东西可能影响军事、情报、经济和国际地位。
安全团队坐在那里。他们想争取更多时间,想检查模型,想做外部监督。
投资人和市场也坐在那里。它们不说话,但每一次估值、股价、订单和舆论,都在提醒公司:快一点。
另一边,是想象中的竞争对手。《AI2027》把中国写进故事,不是为了让读者做简单的国家映射,而是为了制造一个压力:如果你相信对方只落后几个月,你还敢停吗?
这就是《AI2027》的分岔点。
继续跑,可能更快拿到强能力,也可能把不可靠的系统部署到更大的范围。
放慢一点,可能争取安全和监督,也可能在竞赛里失去优势。
《AI2027》写了两个结局:一个是继续竞赛的结局,一个是放慢并加强监督的结局。前者更像灾难片,后者也不是完美乌托邦,因为权力仍然高度集中在少数机构和委员会手里。
这点很值得注意。
《AI2027》不是在说:“只要慢下来,一切就好了。”
它更像在说:当能力足够强、竞争足够激烈、决策足够集中时,连“比较好的结局”也会很别扭。
现实对照
- 现实信号:出口管制、人工智能基础设施、数据中心、电力和国家领先地位,已经进入政府文件和监管语言。企业侧,模型能力、收入、资本开支、云资源和客户部署也绑定在一起,慢下来不再只是技术团队内部决定。
- 边界:模型权重、算法秘密、工具权限、审计日志和网络隔离都变成战略问题,但公开证据仍不足以证明《AI2027》里的权重失窃和治理接管已经发生。
- 读法:第五幕的现实感不是某个角色突然邪恶,而是每个人都带着合理理由,把速度继续往前推,最后把实验室问题变成公司、政府、市场和公众共同面对的问题。

图源:人工智能生成编辑插图,用于表达“继续竞赛还是放慢监督”的治理分岔点。
如果把《AI2027》当成精确预言,它会显得太夸张。
如果把它当成普通科幻,它又太接近现实中的某些压力。
比较好的读法,是把它当成一次沙盘推演。
沙盘推演不是为了证明某一幕一定会发生,而是为了让你提前看到:如果几件事同时变强,局面会怎样变得难收拾。
第一件事,是智能体能不能从“回答问题”变成“持续推进任务”。
第二件事,是人工智能能不能明显加速人工智能研发本身。
第三件事,是算力、电力和数据中心会不会继续变成战略资源。
第四件事,是安全问题会不会从“模型会胡说”变成“系统足够强,但我们看不懂它在做什么”。
第五件事,是公司和国家有没有能力在竞争里保留刹车。
你不需要相信《AI2027》每个月份都对。
你只需要问:这些压力线,现在有没有在变粗?
如果答案是有,那这篇故事就有价值。
我一开始想把《AI2027》拆成表格、指标、来源和反证。
那样做有用,但不适合作为第一篇。
因为大多数读者还没进入问题,就先被表格赶走了。《AI2027》最适合第一眼理解的地方,不是它列了多少预测,而是它有一个非常清楚的戏剧结构:
- 第一幕:不可靠但有价值的人工智能智能体进入工作流。
- 第二幕:算力、数据中心、电力和出口管制把舞台推向机房。
- 第三幕:人工智能从写代码走向加速人工智能研发。
- 第四幕:能力越强,监督越难,错位、欺骗和网络安全风险进入故事中心。
- 第五幕:竞赛 / 减速的分岔点,把公司、政府、安全团队、市场和公众放到同一张桌子前。
这个结构讲清楚了,后面再谈来源、时间线和模型假设,读者才知道这些材料各自放在哪里。
否则,一上来就查材料,像是在没有看过电影的情况下先读影评。
- 《AI2027》官方摘要:提供 2025、2026、2027、竞赛结局和减速结局的主线概括。
- 《AI2027》追踪站导读文章:把故事概括成 2025 热潮、2026 竞赛、2027 转折点三幕,并提示它是一个具体到可被追踪的预测。
- 人工智能安全资料汇编的《AI2027》摘要:整理了更细的月度叙事和“磕磕绊绊的智能体 / 世界上最昂贵的人工智能 / 数据中心里的天才之国”等故事节点。
- LessWrong 社区围绕《AI2027》时间线模型的批评与回应:提醒这套预测的时间线和模型假设争议很大,不能把故事当成已被证明的未来。
- 本地调研目录
10_Projects/AI2027_深度调研/:用于核对五幕主线、现实证据和边界判断;证据截点主要是 2026-05-10。 - OpenAI、METR、Anthropic、英伟达、微软等材料仍作为背景来源:它们用于支撑“编程评测、长任务能力、安全评估、算力和资本开支正在变成现实压力”,但本文不逐条展开。
《AI2027》最让我不安的,不是它写了一个很坏的结局。
而是它把一个更日常的过程写清楚了:每个人都只是在做当下看起来合理的选择,工具更好就多用一点,竞争更强就再快一点,风险还没完全证明就先等等看。
问题是,很多大事并不是从一个疯狂决定开始的。
它们是从一串看起来合理的小决定开始的。
如果人工智能真能把世界推快,我们最先要学会的,可能不是追上它,而是在该慢的时候让它慢下来。
夜雨聆风