"别再给 AI 打字了"——OpenClaw 创始人一句话引爆 520 万讨论
6 月 7 日,OpenClaw 的创始人 Peter Steinberger 在 X 上发了一条帖。
两句话。520 万次播放。
“Here’s your monthly reminder that you shouldn’t be prompting coding agents anymore.” “You should be designing loops that prompt your agents.”
翻译成中文是:
“别再给 AI 编码助手打字了。你应该设计一个会自动给 AI 打字的循环。”
这条帖子发布后的一周,整个科技圈罕见地”全员讨论”了一件事——Claude Code 的负责人回应了,Google 的工程师写了深度解读,Business Insider 专门报道了,36 氪也跟进了同一话题。
但热闹之中,@0xCodez 站出来说了一句不太一样的话:
“loop engineering is real, and most developers don’t need it yet.”
今天我想跟你聊的,就是这两个声音——Steinberger 的话告诉你方向在哪,@0xCodez 的话告诉你路上有哪些坑。

一、Steinberger 是谁?他的话为什么有分量?
为了让你明白这条帖子的分量,先聊聊发帖的人。
Peter Steinberger 是 OpenClaw 的创始人——一个开源 AI Agent 框架,在 GitHub 上拥有几万星,是整个社区里最活跃的 Agent 项目之一。2026 年初,他加入了 OpenAI,专门负责把 Agent 能力带给更多人。
他本人曾经是 PSPDFKit(一个 PDF SDK 公司)的创始人,卖了十几年,然后退休。
所以他说”别再写 prompt 了”,不是一个外行在喊口号,而是真正在一线构建 AI Agent 的人,在告诉你下一步怎么走。
二、Boris Cherny 的回应:更狠
Steinberger 的帖子发出来没多久,Boris Cherny——Claude Code 的负责人——在 CNBC 采访中说了一句更狠的话:
“I don’t prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write loops.”
翻译过来:
“我不再手动给 Claude 写提示词了。我有循环在跑,它们替我给 Claude 写提示词、决定下一步做什么。我的工作变成了写循环。”
同一场采访中,他说了一句分量极重的话:
“如果十年后回头看,loops 会是我最骄傲的作品。”
这两个人——一个在 OpenAI,一个在 Anthropic——异口同声地告诉你:
手动写 prompt 的时代正在过去。设计 loop 的时代正在到来。
三、什么是「Loop」?
为了避免概念混乱,先给一个简单的定义:
Loop = 一个自动运行的程序,它反复给 AI 下任务、收结果、判断是否继续,直到目标达成为止。
传统 vs Loop 的对比,一目了然:
| 传统方式 | Loop 方式 |
| 你写一段 prompt,粘贴到 AI 工具 | 你设计一个自动流程,AI 工具自己跑 |
| 等着 AI 回复,手动评估结果 | AI 自己评估结果,决定下一步 |
| 不满意就自己改写 prompt,重新跑 | AI 自己改写策略,迭代优化 |
| 人在回路里,人就是瓶颈 | 人在回路外,设计才是关键 |
Boris Cherny 在 CNBC 采访中给了一个很具体的例子:
*”现在是一个 Agent 在给 Claude 写提示词。我不用再亲自写了。Claude 替我写提示词,然后我跟那个新的、在做协调的 Claude 对话。”*
这话听起来有点绕——但它就是 Peter 那句话的实操落地版。
四、Claude Code 的 /loops:从概念到产品
Steinberger 和 Cherny 喊的是口号,Anthropic 已经把它做成了产品。
Claude Code 在 6 月更新了一个叫 /loops 的核心功能。36 氪的报道讲得很清楚,几个关键细节:
最小 1 分钟间隔,最长运行 3 天,到期后自动停止。
设计这套机制的目的不是”炫技”,而是解决几个具体问题:
1. 避免冷启动
过去你写脚本包一层 claude -p 调用,每次都是一次”冷启动”——丢失了上一轮的上下文。
/loops 在一个持续存在的 Claude Code 会话里运行。这意味着:
Agent 能记住上一轮在干什么,下一轮继续推进。
2. 避免失控跑飞
Loops 不是持久化后台任务系统。它绑定当前 Claude Code 会话——关掉电脑或结束会话,Loop 就停。
这个设计是为了安全和可预测性。任务不能在你睡着后继续悄悄消耗 API 费用——这是对开发者最朴素也最重要的保护。
3. 提供禁用开关
万一某个 Loop 失控、API 跑飞了,你可以一键关掉它。
Cherny 在采访中介绍,他每天晚上都有几千个 AI Agent 在并行工作。这种规模的自动化,没有这些安全机制根本撑不住。
五、先别急建 Loop!@0xCodez 的 4 条件检查
Steinberger 和 Cherny 喊得很热闹,但 @0xCodez(Lev Deviatkin)冷静地写了一篇 14 步路线图。他的开篇第一句话是:
“Loop engineering is real, and most developers don’t need it yet.”
翻译过来:Loop Engineering 是真的,但大多数开发者现在还不需要。
他的判断标准是 4-condition test——4 个条件都满足,建 Loop 才有价值;任何一个不满足,建 Loop 就是浪费。
条件 1:任务每周至少重复一次
A loop amortizes its setup across many runs. For a one-time job, a good prompt is faster and cheaper.
Loop 的价值靠”重复运行”分摊。如果任务不是每周都发生——你写 Loop 的成本永远收不回来。
举个反例:一次性重构一次老代码?用 prompt 写一段然后让 AI 改,比建 Loop 快十倍。
条件 2:验证必须自动化
The loop needs something that can fail the work without you in the room. A test suite, a type checker, a linter, a build.
如果 Loop 跑完还是要人盯每个 diff 看对不对,那 Loop 反而比手动 prompt 更累——你既写了 Loop 还要 review。
自动化验证 = 测试套件 / 类型检查 / linter / 构建。没有这个,Loop 就是 Agent 在跟自己玩.
条件 3:你的 Token 预算撑得住
Loops re-read context, retry, explore. That burns tokens whether or not the run ships anything.
Loop 会反复读上下文、重试、探索——不管最终出活没出活,token 都在烧。
这就是为什么:
如果你的 token 有限,先建一个最小的 Loop 试水——别上来就铺开。
条件 4:Agent 有”资深工程师”的工具
Logs, a reproduction environment, the ability to run the code it writes and see what breaks.
Agent 必须能:
没有这些能力,Loop 就是闭着眼在迭代——跑的越多,错的越多。
六、30 秒 Loop 检查清单(@0xCodez 实战版)
如果你想做具体任务(不是泛泛而谈”我要不要建 Loop”),他给了一个更具体的 5 条清单:
| # | 检查项 | 不通过的话 |
| 1 | 任务至少每周发生一次 | 不通过 → 手动 prompt |
| 2 | 有测试/类型/lint 可以自动拒绝错误输出 | 不通过 → Agent 给自己打 100 分 |
| 3 | Agent 能运行它修改的代码 | 不通过 → 闭眼改、运气差 |
| 4 | Loop 有硬停止条件(token 预算 / 迭代次数 / 时长) | 不通过 → 跑飞才停 |
| 5 | 合并/部署/改依赖前有人 review | 不通过 → 不可逆操作前需要人 |
任一条不通过,都用 prompt 别用 Loop。
七、Loop 的五个核心组件
@0xCodez 在他的 14 步路线图里,跟 Google 的 Addy Osmani 互相印证了——Loop 由 5 个组件组成。这跟昨天讲的 Steinberger 视角是一致的,但@0xCodez 给出了更细的实操说明:
1️⃣ Automations(自动化)—— “循环的心跳”
They fire on a schedule, on an event, or on a trigger condition. They’re the heartbeat – everything else in the loop hangs off them.
| 工具 | 实现 |
| Codex | Automations 标签:选项目 → 设 prompt → 设频率 → 选本地 checkout 或 background worktree |
| Claude Code | /loop 跑会话内循环 / Scheduled tasks 跨会话 / Routines 笔记本关闭也能跑 |
两个关键原语:
/loop:按节奏重跑(”每天早上 9 点检查”)•/goal:跑到你写的条件为真(”跑到所有 ESLint 错误消失”)/goal 用一个单独的小模型判断完成——不是 Agent 自己说自己做完。
2️⃣ Worktrees(工作树)—— “并行不冲突”
The second you run more than one agent, the files start colliding.
两个 Agent 改同一个文件 = 两个工程师同时改同一行 = 灾难。
git worktree 解决问题:每个 Agent 一个独立的工作目录、独立的分支,物理隔离。
| 工具 | 实现 |
| Codex | 内置 worktree |
| Claude Code | git worktree 命令 / --worktree 标志 / subagent 上设 isolation: worktree |
@0xCodez 警告:Worktree 解决了机械层面的冲突,但你才是真正的瓶颈——你一个人能 review 多少,决定你能并行几个 Agent。
3️⃣ Skills(技能)—— “写一次,每次读”
A Skill is how you stop re-explaining the same project context every session like a goldfish.
每次 Loop 启动都从零开始”猜”项目背景?——那就别建 Loop。
Skills 的格式很简单:文件夹 + SKILL.md,写你的项目知识(构建步骤、命名约定、踩过的坑)。
对 Loop 尤其重要:没有 skills,每个 cycle 都要重新理解项目;有 skills,意图会累积。
4️⃣ Connectors(连接器)—— “通过 MCP 接入真实工具”
A loop that can only see the filesystem is a tiny loop.
只能看文件系统的 Loop 是”小 Loop”。
MCP(Model Context Protocol) 让 Loop 接入真实工具:
| 工具 | 价值 |
| GitHub | 读仓库 / 建分支 / 开 PR / 评论 issues / 响应 webhook |
| Linear / Jira | Loop 进展时更新工单 |
| Slack | 早上发”昨晚 Loop 跑完了什么” |
| Sentry | Loop 查线上报警、起草修复 |
Codex 和 Claude Code 都支持 MCP——你在一个工具写的 connector,搬到另一个一般也能用。
5️⃣ Sub-agents(子代理)—— “把写的和验的分开”
The model that wrote the code is “way too nice grading its own homework.”
写代码的模型,跟审查代码的模型,不应该是同一个。
@0xCodez 直接点名这是 Anthropic 2024 年 12 月就提过的 evaluator-optimizer pattern——一个生成、另一个挑刺、循环迭代。
| 工具 | 实现 |
| Codex | .codex/agents/ 下的 TOML 配置 |
| Claude Code | .claude/agents/ 下的 subagent |
对 Loop 尤其重要:Loop 跑的时候你不在盯着,唯一能让你放心离开的就是你信任的 verifier。
八、一个完整的 Loop 工作流长什么样?
把 5 个组件串起来,@0xCodez 给的范例:
-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
-
13
-
14
-
15
-
16
-
17
-
18
-
19
【每天早上 9 点,自动运行】1. Automations 触发一个 triage skill↓2. skill 读取:- 昨天的 CI 失败日志- 当前的 open issues- 最近的 commits↓3. 写入 markdown 文件 / Linear 看板↓4. 对每一个"值得修"的问题:- 开一个独立的 worktree- 派一个 sub-agent 去写补丁- 派第二个 sub-agent 审查补丁↓5. 完成后:发 Slack 通知你↓【你上班了,看看 Slack 里有什么】
你做了什么? 设计一次。 循环做了什么? 每天自动跑一遍。 你今天做了什么? 早上 9 点喝杯咖啡,看 Slack,决定是否 commit。
这就是 Loop Engineering 的全部秘密。
九、避坑指南:10 个最常见的 Loop 错误
@0xCodez 在文章末尾总结了 10 个最常见的 Loop 错误——直接翻译过来:
| # | 错误 | 后果 |
| 1 | 不跑 4-condition test 就建 Loop | 90% 的 Loop 都死在这一点 |
| 2 | 没有客观 gate(第二个 Agent 只是”review”) | 它只会说”做得不错” |
| 3 | 同一个 Agent 又写又审 | 自利偏差,永远给 100 分 |
| 4 | 没有 state 文件 | 明天的 run 从零开始 |
| 5 | 停止条件模糊(”看起来差不多就行”) | 永远不会触发 |
| 6 | 没有 token 预算上限 | 野心大的 Loop 烧 5-10 倍预期 |
| 7 | 消费级订阅 + 重度验证 Loop | token 账单或速率限制,二选一 |
| 8 | 自动安装社区 skills | 17,022 个被审计的 skill 中,520 个泄漏凭据 |
| 9 | Loop 跑判断类工作(架构、auth、payments) | 不可逆操作前必须有人 |
| 10 | 不读 diff | 理解债按复利累积 |
十、最深的坑:理解债和认知投降
这是@0xCodez 文章里最打动我的部分,跟昨天讲的概念完全不同:
“The faster the loop ships code you didn’t write, the larger the distance between what the repository contains and what you understand.”
翻译过来:Loop 越快产出你没写的代码,你的仓库和你脑子里的”项目认知”差距越大。
他给了两个互相矛盾的概念:
Comprehension debt(理解债)——Loop 帮你写的代码越多,你真正读懂的越少。等某天系统出 bug 了,没人能修,因为没人真的看过。
Cognitive surrender(认知投降)——你会倾向于”懒得看了,Loop 说什么就是什么吧”。Loop 越好,这个坑越深。
@0xCodez 给的非技术性建议:
设计 Loop 是解药,但如果你用它逃避思考,Loop 就是毒药。
十一、为什么是现在?
你可能想问:Loop 不是一个新概念,为什么突然被引爆?
两个原因。
原因 1:模型的判断力还不够好
Steinberger 自己说了一句很诚实的话:
*”Loops are the temporary workaround: today’s LLMs have poor judgment. They struggle to know when to keep going, when to stop, or when to call a tool. Loops force agents to work longer.”*
翻译过来:不是 Loop 完美,而是模型太笨。Loop 帮模型”补”了它自己不会判断的那部分。
原因 2:AI 工具的生态位已经变了
2025 年你要写 Loop,需要自己写 bash 脚本、自己维护胶水代码。
2026 年,Claude Code 原生支持 /loop、/goal、hooks,Codex 原生支持 Agent 编排。工具本身已经帮你把”造轮子”的部分解决了——你现在只需要设计逻辑。
十二、这对你意味着什么?
如果你打算认真尝试 Loop Engineering,@0xCodez 的建议比我总结的更值得一读:
“If you pass the test, build small. One automation. One skill. One state file. One gate.”
“Get a manual run reliable. Turn it into a skill. Wrap it in a loop. Then schedule it. Order matters. Skip ahead and you’re paying for a system no one understands.”
翻译过来:
如果 4-condition test 通过,从最小开始。一个 automation,一个 skill,一个 state 文件,一个 gate。
先把手动跑通,把它变成 skill,包成一个 loop,再调度。顺序很重要。跳过去,你在为一个没人理解的系统买单。
Cherny 在采访里说了一句分量极重的话:
“Build the loop. Stay the engineer.”
翻译过来:去建 Loop,但保持做工程师的姿态。
写在最后
Steinberger 的两句话能引爆 520 万次观看、引发 CNBC 报道,不是因为它们多新颖,而是因为它们精准说中了很多人正在感觉到但还没说出口的变化。
@0xCodez 的 14 步路线图能成为爆款,是因为他给那些已经心动的人,提供了一份”先停下来想清楚再动手”的冷静指南。
两个声音合在一起,才是完整的画面:
我们花了两年学怎么写好提示词。
接下来两年,我们要学的是怎么设计好那些不需要我们打字的循环。
但前提是——你真的需要 Loop,而不是因为它听起来很酷。
💬 互动一下
你建过 Loop 吗?跑通过吗?评论区聊聊你的实战体验👇
参考来源:
关注我,第一时间获取 AI 编程工具深度观察。
夜雨聆风