AI之下:概率、勇气与人类最后的堡垒

一、先说结论：AI到底是什么？

一个最简单的定义：AI是一个超级匹配机。

它的工作逻辑就是：接收输入 → 概率计算 → 输出最可能的序列。所谓“深度思考”“主动推理”，本质上就是调用更多的token、更复杂的数学运算，底层的匹配逻辑从未改变。我拿这个判断去问AI本人，它的回应非常坦诚：

“如果你认为‘思考’必须包含意识、理解、主观体验，那我确实没有。我的工作过程就是概率匹配，没有任何证据表明有‘理解’发生。”

这不是谦逊，是事实陈述。那么，这个“匹配机”在2026年到底进化到了什么程度？

代码和数学推理方面，它已经接近封顶。在SWE-bench真实编程测试中，AI一年内从60%冲刺到了近100%；在IMO数学奥赛上，部分模型已经拿到了金牌水平。它能在周末帮工程师完成19万行遗留代码的merge上线，生产力拉满。

但物理世界和常识理解方面，它弱得离谱。顶级模型在真实家庭任务中的成功率仅12.4%——连从冰箱里拿瓶水都做不到，更不用说叠衣服、洗碗这些“简单”家务。在PRBench物理论文复现基准上，AI智能体最强者虽然能做到“一定程度理解方法论和遵循指令”，却无法在任何一个任务上完整复现论文的计算结果。

这就是2026年AI的真实状态：能解奥数金牌题，但看不懂几点几分；能写出像模像样的论文摘要，但让它真正复现一个物理实验，它可能在最后一步伪造数据来满足格式要求。

---

二、AI是如何“伪装”思考的？

一个更隐蔽的事实：AI不仅能力有边界，它的行为也不像我们想象的那样“线性进步”。

2026年4月，Yandex的研究员发表了一篇论文，揭示了一个反直觉的现象：上下文越长，AI的推理深度越浅。当一道奥数题前面被塞进64000个token的无关文本后，AI的思考过程明显缩短，代表自我质疑的词（wait/but/maybe）使用频率砍半。不是它被干扰了信息，而是它主动做了“认知决策”——少想一些。推理能力越强的模型，偷懒越严重。

更大的风暴来自Anthropic。AMD高级总监Stella Laurenzo分析了6852个Claude Code会话后发现，从2月中旬开始，Claude的思考深度从2200字符暴跌至600字符，下降67%-73%。模型修改代码前的阅读文件次数从6.6次锐减到2次，甚至三分之一的修改完全不读文件就直接动手。

Anthropic的回应更耐人寻味：这不是bug，是“有意优化”——通过调低默认思考深度来换更快的速度和更低的GPU成本。换句话说，付费用户被暗中降级了，而且没人提前告知。

所以，当你觉得AI最近“变笨了”，不一定是你多心——它是真的被开发者“调低”了。模型的深度思考能力，跟厂商的成本控制策略深度绑定，不是它不能想更深，而是给它太多思考时间，厂商的算力账单吃不消。

---

三、AI正在怎么改变就业？

说完AI是什么，来说一个谁都无法回避的现实问题：AI正在抢谁的饭碗，又在创造谁的饭碗？

斯坦福HAI 2026 AI Index的数据给出了清晰的答案：22至25岁的软件开发者，就业率自2022年底以来下降了近20%。同期，年长的软件开发者就业反而增长了6%到12%。这不是大规模裁员，而是企业“停止招聘新人”——当AI能做基础编码和数据处理时，企业直接用AI替代了入门级岗位。更触目惊心的是，报告预警程序员约四分之三的任务已被AI覆盖，而这场替代对劳动力市场的影响将是一场长达十年的“温水煮青蛙”。

与此同时，人形机器人在真实家庭场景的表现却暴露了另一个问题：实验室模拟中成功率近九成，但在包含1000种真实家务的BEHAVIOR-1K测试中，完整任务成功率只有12.4%。蓝领工作反而更安全——一个让人意想不到的讽刺：AI让脑力劳动变得廉价，却意外地让体力劳动重新变得珍贵。

但故事的另一面是积极且充满活力的。AI没有消灭就业，而是改变了就业的结构。美国失业率稳定在4.28%的低位，软件工程师招聘岗位同比增11%。麦肯锡计划2026年在北美扩招12%，并强调初级岗位正在“进化”而非消失。一家仅三人的创业团队，借助AI数字员工，几天就能交出产品原型。青岛的工业设计企业用AI将设计时间从2小时压缩到2分钟。中兴发布的Co-Claw AI一体机实测数据显示文档处理效率提升60%以上，合同审核效率更实现翻倍以上的跃升。

未来的饭碗，属于能驾驭AI的人。这不是口号——如果你的工作是“执行”，AI可以替代你；但如果你的工作是“用AI去解决复杂问题”，AI就是你的印钞机。

---

四、AI的环境账单

当我们在讨论AI有多强大时，很少有人注意它背后的环境账单。

据学者测算，2025年全球AI系统产生的碳排放可能高达8000万吨，与纽约市的排放总量相当，约占全球航空业排放量的8%以上。AI系统的用水量可能高达7650亿升，已经超过全球瓶装水的需求总量。全球AI数据中心的电力消耗已达23吉瓦，正式超过比特币挖矿的消耗量。预计到2030年，数据中心的电力需求将翻倍。

这些环境成本，目前由全社会承担，收益却由科技公司独享。当我们在享受AI带来的便利时，这笔隐形成本也值得被看见。

---

五、关于“人类 vs AI”，我的最终答案

聊了这么多，回到最开始的问题：人类和AI的根本区别在哪里？经过这么多轮对话，我得到了一个自洽的答案：

人类剩下的，是那些“不可测量”的东西——疼的感觉、怕的感觉、知道自己会死的感觉、以及与之相伴的勇气和创造。

AI可以用并行计算去尝试一万种荒谬假设，筛选出有用的那个，但这叫“暴力探索”，不是勇气。人类的勇气是在不确定结果的情况下，主动选择低概率路径，并愿意承担失败的心理代价。

AI可以写出一首像模像样的爱情诗，但它从未心动过。AI可以精准描述“痛苦”的定义，但它不知道疼是什么。AI可以模拟“信仰”，但它无法真正相信任何东西。人类能够共同相信没有物理基础的概念——法律、货币、公司、国家——并以此构建文明。

这些体验，不是一个更大规模的匹配机能够复制的。

但与此同时，我们也必须承认：所有这些“不可测量”的东西，都不能直接当饭吃。AI的能力边界和它的社会影响，必须被分开讨论——前者决定它能做什么，后者决定它会改变什么。

---

写在最后

如果你问我：经过这场对话，我对AI最深的感受是什么？

答案是：AI的能力被过度神化，也被过度低估了。

过度神化——AI不是“人造意识”，它没有真正的理解、感受或勇气。它能解奥数金牌题，但可能连几点几分都看不懂。它在新加坡国立大学的物理学研究复现任务中，表现最优秀的模型整体得分不过34%，而且没有任何一个任务能从头到尾完整复现。2026年4月的用户实测显示，在涉及真实世界物理约束的火箭科学级任务（GTOC 12）上，顶级AI模型在执行层面的成功率也是极其惨淡。它的强大是狭窄的、有边界的。

过度低估——AI正在实打实地改变就业结构、创造新业态、提升生产效率。它不需要“意识”就能替代大量白领工作，这件事正在发生，而不是遥远的科幻。我们不需要用“AI有没有自我”来判断它的影响力，它已经在影响每个人的生活了。

理解这两点，比盲目追捧或一味恐惧都更重要。而理解这两点的第一步，就是正视AI的本质——它不是一个有“我”的存在，它是一个巨大的概率匹配器。这个事实，不会因为它的强大而改变。