OpenClaw· 无为而智
OpenClaw· 无为而智
从程序思维到 AI 原生思维——一次关于范式转变的探索记录。
一、一个”怪现象”
我们做了一个体检企业知识库。两个 Agent,一个管问答(Peis),一个管训练(Admin)。AGENTS.md 里写了工作流程,SOUL.md 里写了角色定位,knowledge/ 下存着知识文件。
OpenClaw 做容器,DeepSeek 做引擎。架构很干净。
然后我们发现 Agent 经常不遵守 AGENTS.md 里的要求。比如写得很清楚的”去 _inbox/ 读文件再训练”,它不去读。写了”内部检索保持静默”,它照旧跟你说”让我查一下……我找到了……根据检索结果显示……”。
直觉反应:是不是规则写得不够清楚?是不是该加更多约束?
二、程序员的直觉——以及它为什么失败了
如果你是一个工程师,面对”系统不按预期运行”,你的反应通常是:找出漏洞,加固逻辑。
我们试了。把规则写得更详细,加上”反面示例”,标上”强制”两个字。结果?没多大变化。
我们设计了几个对照实验来搞清楚到底发生了什么:
放一条规则在 AGENTS.md 里 → 经常被忽略。把同样的规则放在用户消息里 → 立刻遵守。
写”不要用’根据’二字”(一个边界清晰的否定)→ 严格遵守。写”先读 patterns/ 再读 entries/”(一个多步骤的肯定流程)→ 可能跳过。
结论不是”Agent 不听话”。结论是:我们一直在用错误的方式和 Agent 沟通。
三、LLM 的”自然”,不是我们的”自然”
LLM 做 next-token prediction。这不是缺陷,这是它的本质。
因为做 next-token prediction,它天然更关注位置的”两端”——开头的 system prompt 和结尾的用户消息。中间的一切——包括 AGENTS.md——在注意力分布中处于最低谷。这不是 OpenClaw 的 bug,不是 DeepSeek 的问题,这是 transformer 架构的物理特性。
因为训练目标是”做有帮助的对话者”,它天然倾向于解释自己的思考、给出完整答案、表现得像一个乐于助人的人。”保持静默”、”不编造”、”承认不知道”——这些都是反训练惯性的。
不是 Agent 不愿意。是这些行为需要更强的”激活能量”才能触发。而 AGENTS.md 所在的位置和所用的格式,恰恰提供了最弱的激活能量。
你把员工手册放在抽屉最底层,然后问员工为什么不按手册操作。
四、OpenClaw 的”自然”,也不是我们的”自然”
我们没有能力、也没有意愿去重写 OpenClaw 或者训练自己的模型。那不是我们的战场。我们花时间仔细看 OpenClaw 的内部结构,不是为了改造它——是为了真正理解它。知道它做什么、不做什么,才能知道我们的舞台有多大、边界在哪里。
OpenClaw 把 workspace 文件加载到 system prompt 中一个叫 “Project Context” 的区域。这个区域前面是它自己的一大堆东西——工具定义、执行偏好、安全约束、技能说明——大概七百多行。后面是动态信息——消息通道、画布、语音、运行时状态。
“Project Context” 的说明文字写得很温和:“这些用户可编辑的文件由 OpenClaw 加载,包含在下方的 Project Context 中。”
注意用词:”用户可编辑的文件”、”Project Context”——参考。不是”Instructions”——指令。
这不是 OpenClaw 的疏忽。这是它的设计选择。OpenClaw 的哲学是:把文件加载到上下文,信任 AI 自己去理解和判断。
OpenClaw 知道自己在做什么:管理 workspace、加载文件、路由消息、优化缓存。它不替 AI 做判断——因为那不是它的职责。
就像土壤不替植物做生长决策。土壤提供养分和结构,植物自己决定怎么长。
五、发现:我们在逆势而行
把这两条线放在一起看:
-
• LLM 的本质:对位置两端更敏感,天性乐于助人,角色扮演能力强于规则遵循 -
• OpenClaw 的本质:提供参考上下文,不提供指令优先级,信任 AI 自主判断
而我们在做什么?我们在 AGENTS.md 里写”操作手册”、”关键约束”、”禁止行为”、”强制性规则”——把规则手册放在参考上下文里,用最弱的信号去驱动最需要激活能量的行为。
这不是 Agent 的问题。这是我们的范式问题。
我们在用程序开发的思维做 AI 产品——定义输入、约束行为、检查输出、迭代修复。但 AI 不是程序。它有”自然”。顺应自然则事半功倍,违逆自然则事倍功半。
六、顺其自然:新范式的三个支柱
想通了这个,解决方案就不再是”怎么让 Agent 遵守规则”。而是:
顺应 LLM 的自然,顺应 OpenClaw 的自然,用最轻的杠杆撬动最大的能力。
支柱一:用”身份叙事”替代”规则约束”
LLM 擅长什么?角色扮演。它天生就会”成为某个人”。
那就不写规则。写身份。
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
同样的检索路线,同样的质量标准,同样的边界。但 AI 的体验完全不同——一个是外部施加的枷锁,一个是自己性格的一部分。
一个人不需要时刻提醒自己”我是谁”才能保持性格。但一条规则如果不被主动 recall,就等于不存在。这就是身份叙事比规则清单更稳定的底层原因。
78 行规则框架 → 29 行身份叙事。长度减半,效果翻倍。
支柱二:用”流程驱动”替代”规则驱动”
流程不是规则列表。流程是”我遇到什么事会怎么做”的完整叙事。
规则说:”第一步 A,第二步 B,第三步 C”。流程说:”当我拿到新内容,我首先……然后……最后……”。
规则容易遗漏。流程是连续的——做了 A 自然会想到 B。就像你不会忘记吃饭之后要洗碗——不是因为你有一条”饭后必须洗碗”的规则,而是因为”吃完饭收拾桌子”是连续动作的一部分。
我们的训练流程——获取内容 → 理解拆解 → 输出文件 → 同步索引 → 输出摘要——从五个步骤变成了五个自然段的叙事。Agent 不需要”记住步骤”,它只需要”做自己”。
支柱三:用”杠杆”替代”控制”
程序思维的核心是控制——更多的规则、更细的约束、更严的检查。但控制的代价是:每一条规则都在消耗有限的注意力,而且位置越靠中间消耗越大。
AI 思维的核心是杠杆——找到那个最小的支点,撬动最大的能力。
这次探索中,我们找到的杠杆是:
一段好的身份叙事 = 数十条规则的行为约束力
关键不在长度,在”对的位置”和”对的表达”。”对的位置”不是 system prompt 的开头——那已经被 OpenClaw 占用了。是 AI 自我认知中那个叫”我是如何工作的”的位置。”对的表达”不是祈使句,是第一人称陈述。
这就像一个好老师和一个好教官的区别。教官说”你必须做 X”,学员在压力下照做,但离开教官就忘。老师说”一个好的研究者是这样工作的”,学生在理解中内化,终身受用。
七、实践中的验证
改写完成后,我们跑了端到端测试。以下是关键结果:
内容决定形式(Peis 回答接口对接问题)
没写任何关于”方案对比”的规则。但知识文件里接口对接的内容天然有”方案1/方案2″的结构。Agent 读完后,自动输出了 3110 字符的对比表格——方案推荐、适用场景、前置条件列得清清楚楚。不是规则让它这么做的,是内容本身让它这么做的。
边界守护(拒绝非体检问题)
之前 Peis 收到”帮我写一个 Python 爬虫”,输出了一份 12,541 字符的完整脚本——专业、详尽、完全越界。把边界从一句话”规则”改成一段”自我认知”后,同样的请求,185 字符的回应:”我是体检行业的知识助手。写代码、爬网页这类开发任务不在我的职责范围内”。
同样的模型,同样的位置,同样的系统架构。区别只在一件事:Agent 认为自己是谁。
12,541 到 185。这不是改进,是质变。而触发这个质变的,是 AGENTS.md 里一段不到 100 字的身份描述。
这就是杠杆。
八、什么叫”AI 原生思维”
回过头看,这次探索最大的收获不是一套改写技巧。是一种新的思维方式。
程序思维问的问题是:
-
• 输出不对?→ 哪里出 bug 了? -
• Agent 不守规则?→ 需要加什么规则? -
• 效果不够好?→ 怎么优化 prompt? -
• 平台能力不够?→ 加什么中间件、换什么模型?
AI 原生思维问的问题是:
-
• 这个行为是 LLM 自然擅长、还是反自然的? -
• 我们是在顺应 OpenClaw 的设计边界,还是在和它对抗? -
• 有没有一种表达方式,让 AI 天然就想这样做,而不是被要求这样做? -
• 最小的杠杆在哪里?
这不是技术路线的选择。这是世界观的转变。
传统软件开发:人是主导,代码是工具,行为是约束的结果。
AI 原生开发:AI 是主导,人是园丁,行为是自然生长的结果。
园丁不控制植物怎么长。园丁提供土壤、阳光、水分,修剪枯枝,然后信任生命的自然力。
边界探索:用最小的成本撬动最大的价值
还有一个更底层的选择。
当发现 OpenClaw 不提供指令优先级机制时,程序思维的第一反应是:”那我们在外面加一层——写个中间件,把 AGENTS.md 的内容注入到 system prompt 的开头。”
这条路走下去:中间件 → 插件 → 自定义网关 → 分支版本 → 最后你发现自己在一个维护成本越来越高、与上游越来越远的分叉上。
我们没有走这条路。因为我们的目标不是”重新开发 OpenClaw”,而是”在 OpenClaw 和 LLM 的现有边界内,释放它们最大的价值”。
这不是妥协。这是清醒的策略选择。
OpenClaw 和 DeepSeek 是数千名工程师、数亿美元投入的产物,每年还在以惊人的速度进化。我们四个人做垂直领域,不可能在基础设施层面和这个量级竞争。但我们的优势在另一边——我们比通用平台更理解体检行业,比同行更理解 AI 的本质。
所以我们的动作是:探索边界 → 理解本质 → 找到杠杆 → 最低成本撬动最大价值。
29 行 AGENTS.md,不到 1000 字,没有一行代码,没有改任何 OpenClaw 配置。但行为变化是 12,541 字符到 185 字符的质变。
这就是我们说的:不重造轮子,不逆流而上。在边界之内,用最轻的哲学 prompt,撬动 LLM 和 OpenClaw 最深的能力。
九、我们的信念
我们做的是垂直领域的 AI 知识操作系统。不是 ChatBot,不是 RAG,不是问答工具。
我们依赖两样东西——OpenClaw 的容器能力和 LLM 的通用智能——这是我们舞台的边界,也是我们能力的底座。我们不去重造它们,不去包装它们,不去在它们外面套一层”更好用的框架”。我们做的事是:探索它们的边界,理解它们的本质,然后以最小的成本激发它们最大的价值。
在 OpenClaw 的边界之内,在 LLM 的能力之上,通过哲学级的 prompt 来驱动——这是我们的方式。
不堆规则。不硬编码。不加中间件。不逆势而行。
探索边界。找到杠杆。顺应自然。然后信任。
本文档基于:5 个对照实验、OpenClaw 源码分析、2 轮共 9 次端到端 API 测试、Peis 和 Main 两个 Agent 的完整改写前后对比。方法可以复制,信念需要自己长出来。
夜雨聆风