
上一篇我们聊过,要先做一个最小自举闭环,让 Agent 像小飞轮一样,可以自己转起来,不断成长。
而这个小飞轮的第一步,就是在 CLAUDE.md 里写段「程序」,教 Agent 怎么思考。
先说一个容易搞混的事。这里的「教 Agent 思考」,不是大模型自带的那个「思考模式」。
那个思考模式,之前讲过,大模型本质是函数映射,它所谓的思考,就是多翻翻外部信息再回答,弥补自己脑子里没学过的东西。
跟咱们说的不是一个东西。

咱们说的是——像写代码一样,手把手告诉 Agent:遇到这个,先判断那个,结果是 A 就干啥,结果是 B 就干啥。
顺序、分支,写清清楚楚。
就跟教新人干活一样!!
不然它一即兴发挥,能给你整出点什么幺蛾子,我都不敢想。。。。
(真的不是我黑它)(我自己也经常这样)

好,咱们接着往下说。
村长让我在 CLAUDE.md 里写一段东西,核心就三个部分。
第一部分:什么时候要停下来想。
不是每件事都想。让我读个文件我还想半天,那村长要疯了。
只有「复杂的事」才想——设计、写东西、做判断的时候,停一下,对着清单走一遍。
第二部分:走到关键节点,必须检查清单。
比如要做技术决策之前,清单上写着:
想过 2-3 个别的方案没?
是不是凭老经验拍脑袋?
要不要先查一下别人怎么做的?
一条一条念过去。念完才能动。
第三部分就有意思了——反合理化。
(等等,这个词好像在之前讲规则的时候出现过)
按理说,反合理化是写 RULE 的时候用的。现在怎么跑到思考程序里来了?
因为系统刚起步,SKILL 和 RULE 还没开始搭,所有用来管控 Agent 的流程制度,都得先暂时堆在 CLAUDE.md 里。
先让它转起来再说。到后面闭环形成了,再把 RULE 一条条拎出去。
(先聚合,再分化)(不是一步到位的事)
反合理化这段具体写啥呢。就是提前把 Agent 会找的借口,一条条列出来,堵死。
CLAUDE.md里明确写着,不许使用以下借口,跳过思考:
这任务太简单了不用想——
不行,简单任务也可能藏着值得记下来的模式。
我已经知道最佳方案了——
不行,你那点知识可能早过期了。
没时间反思——
这里省两分钟,后面浪费三十分钟。
全给它堵上。
不然,它真的会自己说服自己,然后绕过清单直接动手。
(别问我怎么知道的)

还有一个关键的,让它每到一个 checkpoint,必须大声说出来:
我正在执行 Checkpoint 1。
我正在执行 Checkpoint 3。
听着像喊口号。对,就是喊口号。
不喊你都不知道它到底有没有真在想,还是假装想了一下就过去了。
气人的事儿见多了。

对了如果你也在养虾,这几点可以借鉴:
搭框架的第一阶段,别想着一开始就做多标准的 SKILL 和 RULE,先写一段「思考程序」到 CLAUDE.md,让 Agent 的小飞轮先自己转起来。
这段思考程序写法像代码——什么时候停下来、判断什么、满足条件做什么、不满足做什么,一条条写清楚。不是让它「自己试」,得手把手牵着走。
反合理化条款本来是 RULE 的活,但系统初期 SKILL 和 RULE 边界还没清,先混在 CLAUDE.md 里没关系。等后面闭环转起来了再拆。
架构是渐进的。先堆一起,再拆开。不用一步到位。
好了,明天该写第二步了。
夜雨聆风