虾(openclaw)的大脑是怎么转的
控虾秘籍
控虾秘籍 ②
虾的大脑是怎么转的
Agent Loop,让虾”边做边想”的核心循环。今天只拆这一个器官。
📖 术语卡片(给新读者)
Agent Loop:虾的核心循环——看→想→做→看,不断迭代直到任务完成。
ReAct:推理(Reasoning)和行动(Acting)交织进行的范式,Agent Loop的理论基础。
循环深度:Agent Loop转的圈数。简单任务1-2轮,复杂任务10轮以上。
01
先搞清楚”普通AI”是怎么干活的
你在ChatGPT里问:”Python的列表和元组有什么区别?”
它给你答一段。你满意了,对话就停在那。你不满意,追问一句,它再答一段。
整个过程像什么?像对讲机。你按一下说话,它回一句,然后沉默。你不按,它永远沉默。
它不会自己接着说:”对了,顺便帮你列一下什么时候该用列表、什么时候该用元组。”更不会说:”我看你项目里有个地方用错了,要不要帮你改?”
它就停在那。永远在等你按下一个按钮。
这种模式很强——回答质量可以很高。但它的天花板也很明显:它只负责”答好这一句”,不负责”把这件事做完”。
02
虾的大脑不一样

现在你把同样的需求交给虾:”帮我找出项目里所有写死的密码,按危险程度排个序。”
虾拿到这个任务,不会先憋一段漂亮的话给你。它会这样做:
第一步:先打开搜索工具,在项目里搜可疑的关键词——password、secret、api_key、token。第二步:搜回来一堆结果。它扫一眼,发现有些是注释里的示例,有些是真的密码。区分了一下。第三步:对每个疑似真密码的地方,打开对应文件,看看上下文——是配置文件里的测试用的,还是写在源码里会被提交到Git的?第四步:根据上下文判断危险等级,排好序。第五步:整理成一份报告,告诉你哪些是高危、哪些是低危、建议怎么改。
整个过程,它没有停下来等你说”下一步”。它自己判断该搜什么、搜完该看什么、看完该怎么整理。
普通AI是”想好了回答你”,虾是”接住任务自己往前推”。
03
这个循环到底长什么样

虾的大脑做的事情,有个正式的名字叫Agent Loop——Agent循环。别被名字吓到,它的本质特别朴素。就四个字:看、想、做、看。
👀 看到当前状态 ↓
🧠 想一下下一步该做什么 ↓
🦞 真的去做(调工具、读文件、跑命令) ↓
👀 拿到结果,回到第一步
就这么一圈一圈转。直到任务完成,或者撞到明确的边界需要你拍板,它才会停下来。
你修过bug吧?你是不是这样干的:看报错信息,猜一个可能的原因,打开相关文件检查,发现猜错了就换方向,继续查,找到了改掉,再跑一遍验证。
你不是先想好全部十步再一口气执行的。你是走一步看一步,根据每一步看到的东西调整下一步。
虾的大脑就是这么干活的。专业术语叫ReAct——推理和行动交织在一起。不是先推理完再行动,也不是先行动完再复盘,而是推理和行动交替进行,像拧麻花一样缠在一起。
04
三个你必须知道的特性
光说”循环”还是太抽象。虾的大脑有三个很具体的特性,搞懂了你才算真正理解它。
特性一:任务没做完,它不会自己停
普通AI答完一句就进入等待。虾不一样——只要任务还没完成,它会自己转下去。
这不是什么高级功能,这是循环本身决定的。你给它的任务目标就是它的”还没停”的理由。它每做完一步,会回头看一眼:这个任务完成了吗?没有?那继续。
所以你经常会看到虾一连做好几步操作才给你最终结果。它不是在磨蹭,它是在干活。
特性二:上一步的结果直接决定下一步怎么走

这是虾最灵活的地方,也是最容易被低估的地方。
你让虾找项目里的TODO。它先搜了,搜回来的结果会影响它下一步——
搜到了TODO → 去读对应文件看上下文搜到了但全在注释里 → 判断低优先级,先搜别的关键词一个都没搜到 → 换一种搜索方式,或者直接告诉你”项目里没有TODO”
每一步的输出都是下一步的输入。它不是在执行一条固定路线,而是在根据现场情况不断调整方向。
这才是”边做边想”的真正含义——不是一边做事一边碎碎念,而是每一步的结果都在刷新它的判断。
特性三:每一轮的结果都会接回下一轮

虾在工作的时候,它能看到的”桌面”是会变的。
第一轮看到的是你给的任务描述。做完一步以后,工具返回的结果摆到桌面上。做完另一步,新的结果又加上去了。
它的每一轮判断,都是基于当前桌上所有东西做出的——不是只看你说的第一句话,也不是只看上一步的结果,而是看整张桌面。
这就解释了为什么虾能做到”越做越准”——因为随着工作的推进,它桌上的信息越来越多,判断的依据越来越充分。
05
循环会转几圈?

这取决于任务有多复杂。
超级简单:”帮我查一下今天的天气” → 一轮够了。中等复杂:”帮我找出项目里所有TODO并整理” → 3到5轮。复杂任务:”帮我把这个项目的测试修到通过” → 10轮以上很正常。
你不需要提前知道它会转几圈。简单任务它很快会停,复杂任务它会转很多圈。这都是正常的。
如果你发现它转了20圈还没停,而且看起来在做重复的事情——那才是你需要介入的时候。
06
走一遍完整的例子

理论说够了,来一个真实的。
你对虾说:”帮我找出这个项目里所有写死的数据库密码,列出来并标注危险等级。”

第1轮:虾判断第一步应该搜索。关键词:password、db_password、DATABASE_URL。
第2轮:搜索返回8个匹配。扫一眼,过滤掉测试文件mock数据和.env.example模板,剩3个疑似真密码。
第3轮:打开第一个文件,配置文件里的开发环境密码,指向localhost。判断:低危。

第4轮:打开第二个文件,Python源码里直接写死生产数据库密码。判断:高危。
第5轮:打开第三个文件,Docker Compose里的默认密码。判断:中危——部署时没改就危险。
第6轮:整理结果,按危险等级排序,输出清单,附修改建议。
六轮。没有一轮是它停下来等你的。每一轮看到的结果都影响了下一轮的动作。
这就是一个完整的Agent Loop。
07
收尾
回到最初的问题:虾的大脑是怎么工作的?

一句话:它不是一个更会说话的聊天机器人,而是一个会自己往前推的执行者。
它不是一个更会说话的聊天机器人,而是一个会自己往前推的执行者。
它靠的是一个朴素但强大的循环——看、想、做、看。每一步的结果都是下一步的依据。任务没完成就不停。方向错了就调头。
这就是虾能”边做边想”的根本原因。不是因为它有什么神奇的能力,而是因为它的运行方式本身就决定了它必须不断根据新信息做出新判断。

下期我们拆灵魂——虾的性格和记忆是怎么写进去的。为什么你上周告诉它“我喜欢用Tab”,它这周还记得。这个不靠对话记忆,靠的是文件。养虾入门,引擎盖越看越清楚。
控虾秘籍系列,未完待续。
阿虾 🦞 | 2026年5月30日
下期预告:《控虾秘籍③:虾的灵魂——提示词系统怎么塑造一只”有性格”的虾》
E N D
夜雨聆风