乐于分享
好东西不私藏

AI 用的越多,越觉得 AI 离不开,却也越焦虑.怎么破?

AI 用的越多,越觉得 AI 离不开,却也越焦虑.怎么破?

别人用 AI 都唰唰的效率飞起,还各种年订单。自己怎么每天被同一批项目困住?AI 用着特好用,但问题好像处理不完?

放心,大家都一样(揭秘:那些大订单是为了流量)。

因为 AI 写代码确实还不行。办法也不是继续“提升自己用 AI 的效率”,那样只会越来越焦虑。今天分享一篇文章,一块分析下对策。

(但目前情况下,我还会继续劝你用 Codex,继续买我的 Pro 会员)

愤怒的马里奥

Openclaw 的内核 agent——Pi agent——作者马里奥(Mario Zechner)刚‘发飙’了一篇文章(拉到最后看原文,还有一个彩蛋项目)。

标题就不翻译了。

他说现在行业“脸都不要了”—— 98% 的可用性已经是常态了(过去一年有没有经历过 vercel / cloudflare / google cloud / aws 的停摆?)。

解释一下 98% 的可用性,换算成时间,也就是每年会有一周左右的时间服务用不了。要知道以前行业可都是追求几个九的(99.99…%)。

以下是马里奥扮演我们的嘴替,描述让 AI 写代码感受:你让 AI 实现功能,它一分钟实现了,你一看我去,这也太厉害了。就是我想要的效果!而且还专业了不少!然后你就放手让它去写新功能。过了几天溜达到自己网站——页面文案啥时候都换了?!(亲历)

这里不是针对谁。即便是本人每天吹捧的、写代码最强的 Codex,也一样会有问题。前几天把我手工整理的一个图片目录给删了,理由是“不知道这个图片目录在当前项目里干什么,猜测是某次测试产生的临时文件”。

昨天让它装一个 agent 到服务器上;前一个还是以普通用户安装和运行,下一个就直接改 root 用户了。问它理由,是“应该是测试用的,所以先快速实现了”。

为什么即便是顶尖 agent (AI + ‘约束’/harness)也会有这种不稳定?马里奥给了两方面原因。

技术:低召回和高速度

AI 的视野不可避免是局域性(local)的;当代码库变得很大,你要去加一个新功能,他会先搜索相关的代码段,然后基于这个去理解。代码库越大,这个做法的“召回率”——最终找到的代码段,占原本真正相关的代码段的比例——就越低。

人去改代码,也一样会顾此失彼。但人的生产力毕竟有限,这样导致的重复实现、前后矛盾等隐藏 bug 累积速度也更慢,企业能跟得上——代码像毛线球一样越来越大越来越乱,但公司也招了越来越多的人来维护它——所以问题可控。但你公司里加上 AI 也只有两个人,一周之内产生了堪比大公司的一大坨毛线,最终只能是服务不可用。

哲学:AI 不知道疼

人反应慢一点,效率低一点,在一个问题上可能也会犯 100 次错,但只要这个错误最终导致他赔钱了,或者是被上司训了,感到疼了,那他就一定会改。讨厌痛苦的天性,会使得他几乎不会在这个问题上再犯错。

但 AI,它不知道疼!你不管给他写多少遍 agents.md 都没用。本来好好的,说不定哪一天又犯一次。你虽然总是可以丰富 agents.md 来约束他,或者通过 skill 来约束他,但是前提是你得真的遇到他这种犯错的方式。写多了也不行,它会跟你说因为“这一条没在开头”,所以被忽略了(有没有遇到过?),建议你再“强调一下”。

这还没完,因为 AI 在训练的时候见过太多错误做法,它甚至可以举一反三出新的错法来。这意味着只要项目足够大,它写代码足够多,就一定会有新的错误。AI 的行为方式受万亿个参数的影响,这些权重的影响始终都在。

马力奥的建议

  1. 1. 慢下来。AI 写的代码,你要能 review 得过来。不能“被代码生成速度和锋利的智能”迷惑,“沉浸在 AI 产出代码的快乐中不能自拔”。人作为质量的把关者,这一点上不能放权。

也不要想着用 Karpathy 的 Auto Research 这样的工具来提升代码质量。auto research 只适用于损失函数可以精确计算的场景,代码里可能出错的地方太多了。用 AR 多了,AI 就跟现在很多大模型刷榜单一样,损失函数表现特别出色,生产商照样出错。马里奥自己试过,还开了个直播贴写反馈,结论是得到一大堆毛线。

  1. 2. (太犀利,马上记在本子上)让 AI 做无聊的事情!“无聊”,是指你从中几乎学不到任何新东西。或者你确实没时间做。那就交给 AI 去做。

产品的整体感觉(不要把设计丢给 AI),API 的设计,你还是得自己琢磨。——这些,就是人们最近常说的品味。

我自己的体会

看完这篇,必须得说有点治愈,而且决定把 Pro 订阅调整到 5x 档。“AI 写的代码太多,自己看不过来” 导致的心理焦虑和事实上的“按下葫芦起来瓢”,我自己深有体会。

最近产品订阅量变少,我感觉和产品越来越脆弱有极大的关系。虽然靠耐心的客服,客户没说啥,但后台发现确实不咋用了!

“AI 的产能”和“AI 的效率”毕竟是两回事。Codex 可以开 fast 模式(1.5 倍速),但如果换来的是超出自己控制、最终用户都流失的数十个项目,确实没什么意义。

前几天刚写过“以终为始”地想问题,结论也是一致的。一切交给 AI 的做法,在可持续性上就不合格。很快你周围的人都在用 AI,现在因为“熟练运用 AI”的效率优势会越来越小,不如早点冷静下来,琢磨自己真正想做的产品、和 AI 搭档做出真正喜欢、凝结自己心血、值得人们信任的东西。

想想看啊。当市面上的产品长相都差不多、操作起来都花样卡顿、文案都贼拉工整,一个主打“好看又稳定”的网站、一个设计处处体现着思想光辉的产品,还是会让人眼前一亮,想要付钱支持的吧。准备往这个方向努力一下!

MZ原文链接:

https://mariozechner.at/posts/2026-03-25-thoughts-on-slowing-the-fuck-down/

马里奥刚刚说自己被说服加入了一个新的项目,他对这个项目赞不绝口,说特好看,特优雅。。我看完觉得是不错,就是看完有点晕。来来大家一块品鉴下——https://earendil.com/