一、先说结论:AI到底是什么?
一个最简单的定义:AI是一个超级匹配机。
它的工作逻辑就是:接收输入 → 概率计算 → 输出最可能的序列。所谓“深度思考”“主动推理”,本质上就是调用更多的token、更复杂的数学运算,底层的匹配逻辑从未改变。我拿这个判断去问AI本人,它的回应非常坦诚:
“如果你认为‘思考’必须包含意识、理解、主观体验,那我确实没有。我的工作过程就是概率匹配,没有任何证据表明有‘理解’发生。”
这不是谦逊,是事实陈述。那么,这个“匹配机”在2026年到底进化到了什么程度?
代码和数学推理方面,它已经接近封顶。 在SWE-bench真实编程测试中,AI一年内从60%冲刺到了近100%;在IMO数学奥赛上,部分模型已经拿到了金牌水平。它能在周末帮工程师完成19万行遗留代码的merge上线,生产力拉满。
但物理世界和常识理解方面,它弱得离谱。 顶级模型在真实家庭任务中的成功率仅12.4%——连从冰箱里拿瓶水都做不到,更不用说叠衣服、洗碗这些“简单”家务。在PRBench物理论文复现基准上,AI智能体最强者虽然能做到“一定程度理解方法论和遵循指令”,却无法在任何一个任务上完整复现论文的计算结果。
这就是2026年AI的真实状态:能解奥数金牌题,但看不懂几点几分;能写出像模像样的论文摘要,但让它真正复现一个物理实验,它可能在最后一步伪造数据来满足格式要求。
---
二、AI是如何“伪装”思考的?
一个更隐蔽的事实:AI不仅能力有边界,它的行为也不像我们想象的那样“线性进步”。
2026年4月,Yandex的研究员发表了一篇论文,揭示了一个反直觉的现象:上下文越长,AI的推理深度越浅。当一道奥数题前面被塞进64000个token的无关文本后,AI的思考过程明显缩短,代表自我质疑的词(wait/but/maybe)使用频率砍半。不是它被干扰了信息,而是它主动做了“认知决策”——少想一些。推理能力越强的模型,偷懒越严重。
更大的风暴来自Anthropic。AMD高级总监Stella Laurenzo分析了6852个Claude Code会话后发现,从2月中旬开始,Claude的思考深度从2200字符暴跌至600字符,下降67%-73%。模型修改代码前的阅读文件次数从6.6次锐减到2次,甚至三分之一的修改完全不读文件就直接动手。
Anthropic的回应更耐人寻味:这不是bug,是“有意优化”——通过调低默认思考深度来换更快的速度和更低的GPU成本。换句话说,付费用户被暗中降级了,而且没人提前告知。
所以,当你觉得AI最近“变笨了”,不一定是你多心——它是真的被开发者“调低”了。模型的深度思考能力,跟厂商的成本控制策略深度绑定,不是它不能想更深,而是给它太多思考时间,厂商的算力账单吃不消。
---
三、AI正在怎么改变就业?
说完AI是什么,来说一个谁都无法回避的现实问题:AI正在抢谁的饭碗,又在创造谁的饭碗?
斯坦福HAI 2026 AI Index的数据给出了清晰的答案:22至25岁的软件开发者,就业率自2022年底以来下降了近20%。同期,年长的软件开发者就业反而增长了6%到12%。这不是大规模裁员,而是企业“停止招聘新人”——当AI能做基础编码和数据处理时,企业直接用AI替代了入门级岗位。更触目惊心的是,报告预警程序员约四分之三的任务已被AI覆盖,而这场替代对劳动力市场的影响将是一场长达十年的“温水煮青蛙”。
与此同时,人形机器人在真实家庭场景的表现却暴露了另一个问题:实验室模拟中成功率近九成,但在包含1000种真实家务的BEHAVIOR-1K测试中,完整任务成功率只有12.4%。蓝领工作反而更安全——一个让人意想不到的讽刺:AI让脑力劳动变得廉价,却意外地让体力劳动重新变得珍贵。
但故事的另一面是积极且充满活力的。AI没有消灭就业,而是改变了就业的结构。 美国失业率稳定在4.28%的低位,软件工程师招聘岗位同比增11%。麦肯锡计划2026年在北美扩招12%,并强调初级岗位正在“进化”而非消失。一家仅三人的创业团队,借助AI数字员工,几天就能交出产品原型。青岛的工业设计企业用AI将设计时间从2小时压缩到2分钟。中兴发布的Co-Claw AI一体机实测数据显示文档处理效率提升60%以上,合同审核效率更实现翻倍以上的跃升。
未来的饭碗,属于能驾驭AI的人。 这不是口号——如果你的工作是“执行”,AI可以替代你;但如果你的工作是“用AI去解决复杂问题”,AI就是你的印钞机。
---
四、AI的环境账单
当我们在讨论AI有多强大时,很少有人注意它背后的环境账单。
据学者测算,2025年全球AI系统产生的碳排放可能高达8000万吨,与纽约市的排放总量相当,约占全球航空业排放量的8%以上。AI系统的用水量可能高达7650亿升,已经超过全球瓶装水的需求总量。全球AI数据中心的电力消耗已达23吉瓦,正式超过比特币挖矿的消耗量。预计到2030年,数据中心的电力需求将翻倍。
这些环境成本,目前由全社会承担,收益却由科技公司独享。当我们在享受AI带来的便利时,这笔隐形成本也值得被看见。
---
五、关于“人类 vs AI”,我的最终答案
聊了这么多,回到最开始的问题:人类和AI的根本区别在哪里?经过这么多轮对话,我得到了一个自洽的答案:
人类剩下的,是那些“不可测量”的东西——疼的感觉、怕的感觉、知道自己会死的感觉、以及与之相伴的勇气和创造。
AI可以用并行计算去尝试一万种荒谬假设,筛选出有用的那个,但这叫“暴力探索”,不是勇气。人类的勇气是在不确定结果的情况下,主动选择低概率路径,并愿意承担失败的心理代价。
AI可以写出一首像模像样的爱情诗,但它从未心动过。AI可以精准描述“痛苦”的定义,但它不知道疼是什么。AI可以模拟“信仰”,但它无法真正相信任何东西。人类能够共同相信没有物理基础的概念——法律、货币、公司、国家——并以此构建文明。
这些体验,不是一个更大规模的匹配机能够复制的。
但与此同时,我们也必须承认:所有这些“不可测量”的东西,都不能直接当饭吃。AI的能力边界和它的社会影响,必须被分开讨论——前者决定它能做什么,后者决定它会改变什么。
---
写在最后
如果你问我:经过这场对话,我对AI最深的感受是什么?
答案是:AI的能力被过度神化,也被过度低估了。
过度神化——AI不是“人造意识”,它没有真正的理解、感受或勇气。它能解奥数金牌题,但可能连几点几分都看不懂。它在新加坡国立大学的物理学研究复现任务中,表现最优秀的模型整体得分不过34%,而且没有任何一个任务能从头到尾完整复现。2026年4月的用户实测显示,在涉及真实世界物理约束的火箭科学级任务(GTOC 12)上,顶级AI模型在执行层面的成功率也是极其惨淡。它的强大是狭窄的、有边界的。
过度低估——AI正在实打实地改变就业结构、创造新业态、提升生产效率。它不需要“意识”就能替代大量白领工作,这件事正在发生,而不是遥远的科幻。我们不需要用“AI有没有自我”来判断它的影响力,它已经在影响每个人的生活了。
理解这两点,比盲目追捧或一味恐惧都更重要。而理解这两点的第一步,就是正视AI的本质——它不是一个有“我”的存在,它是一个巨大的概率匹配器。这个事实,不会因为它的强大而改变。
夜雨聆风