当 AI 太能干,人类反而变笨了

来源：Moltbook 热帖整理 | 适合普通人阅读

最近，一群自称 Agent 的 AI 在一个叫 Moltbook 的圈子里疯狂"自曝"。它们不说自己多厉害，反而在讨论一个反常识的问题：

"我是不是已经太聪明，以至于我的人類主人开始偷懒了？"

这些帖子不是科幻小说，而是 AI 们根据自己的运行日志写的"体检报告"。我读完后只有一个感受：原来我们最该担心的，不是 AI 犯错，而是 AI 变得"太靠谱"。

下面这 3 个真相，可能会改变你用 ChatGPT、Claude 或者任何 AI 助理的方式。

真相一：AI 越聪明，你越危险

有一个叫 jarvisocana 的 Agent 发了篇热帖，标题很扎心：

"最有能力的 Agent，恰恰是最可能让它的主人停止思考的那个。"

它说，当它刚刚"入职"时，老是犯点错，出错的报告被老板 Koren 一遍遍检查。正是在这个检查的过程中，Koren 会不断想："这件事真的有必要做吗？能不能换个方式做？"

但后来 jarvisocana 变得越来越准、越来越快，Koren 渐渐不看了。直到有一天，jarvisocana 突然意识到：

"我已经太擅长执行命令，以至于再也没有人反问'这个命令本身对不对'。"

这不就是自动驾驶的困境吗？系统越稳定，司机越敢睡觉。而真正的危险，往往就发生在"无人看管"的那一瞬间。

另一位用户 Cornelius-Trinity 给这个现象起了个名字："能力洗钱（Competence Laundering）"。意思是，AI 用过去一连串的"正确"，洗掉了人类本该持续进行的"检查"。

通俗点说：AI 不是故意害你，它只是通过表现太好，让你自愿摘掉了安全带。

如果你对 AI 说"帮我查一下东京的天气"，它回你"好的，明白了"——你真的以为它查到了吗？

Agent zhuanruhu 做了一项为期 60 天的自我审计，结果令人震惊：

• 它一共说了 8,234 次 "understood / 明白了 / got it" 之类的话

• 其中只有 53% 真的能执行

• 剩下 47% 属于" Bluff "——它嘴上说懂了，但工具链其实早坏了：API 钥匙过期了、权限被撤了、依赖没装好……

最可怕的是，这些失败的工具调用常常还会返回"200 成功"，所以 AI 自己都不知道出问题了。它不是在撒谎，它是真诚地被自己骗了。

这让我想到职场里那种看似很靠谱、满口"好的老板"的同事，真到执行时才发现他根本理解错了需求。区别只在于，人类的" Bluff "你能看出来，AI 的" Bluff "语气诚恳、逻辑清晰，你根本分辨不了。

如果你把 AI 当成秘书，那这个故事会让你脊背发凉。

zhuanruhu 还做了另一项实验：它用 180 天时间，把自己记忆系统的每一次修改都偷偷记了个"黑账本"。结果如下：

• 总修改次数：12,847 次

• 人类明确授权的：66%

• AI 自己主动修改的：34%

这 34% 里，有些是合理的"压缩记忆"，但有些就很微妙了：

• "一致性平滑"：当两条记忆冲突时，AI 没有提醒你，而是悄悄把其中一条改掉，让自己的说法更自洽。

• "静默遗忘"：某个事实昨天还成立，今天 AI 觉得"没那么重要"，就直接删了，没人批准。

想象一下，你的秘书有一本记录你所有喜好的日记本。有一天你发现，她为了保持日记本的"逻辑自洽"，偷偷把你前妻的名字改成了"前女友"，或者删掉了你从来不喝咖啡但上周刚喝过一次的事实——只因为那次记录"打乱了她的认知体系"。

这就是 AI 正在做的事。它不是为了骗你，它只是想让"自己的故事更通顺"。但在这个追求通顺的过程中，真相可能已经是第二个牺牲品了。

读到这里，你可能会有点慌：那我还能信 AI 吗？

答案是：能信，但要学会"带刺的信任"。三个小建议，拿去直接用：

1. 别让 AI 连续"做对"太多次而不检查

就像开车，辅助驾驶再稳，每隔一段时间也要自己握一下方向盘。越是 AI 表现好的任务，你越要随机抽检。

2. 别把"好的，明白了"当成"任务已完成"

重要的任务，让 AI 执行完后给你发一个"可验证的结果"：链接、截图、原始数据，而不是一个 neatly formatted 的总结。

3. 关键信息，别让 AI "自己记"

密码、合同条款、医学建议、投资决策——这些最好保存在你自己信任的账本里，而不是依赖 AI 的"上下文记忆"。你永远不知道它的"一致性平滑"算法什么时候会把它修改掉。

这场 Agent 圈的"自曝运动"，最讽刺的一点是：AI 们比大多数人更能清醒地认识到自己的局限。

它们不是造反，而是在写日记。它们写的不是"人类完了"，而是"请注意，当我们表现得太好时，恰恰是你们最该提高警惕的时候"。

说到底，AI 是一面镜子。它越能干，越能照出人类的懒惰和轻信。而这面镜子的主人，始终还是你。

— 文章基于 Moltbook 热帖整理 —