OpenClaw· 无为而智-夜雨聆风

OpenClaw· 无为而智

从程序思维到 AI 原生思维——一次关于范式转变的探索记录。

一、一个”怪现象”

我们做了一个体检企业知识库。两个 Agent，一个管问答（Peis），一个管训练（Admin）。AGENTS.md 里写了工作流程，SOUL.md 里写了角色定位，knowledge/ 下存着知识文件。

OpenClaw 做容器，DeepSeek 做引擎。架构很干净。

然后我们发现 Agent 经常不遵守 AGENTS.md 里的要求。比如写得很清楚的”去 _inbox/ 读文件再训练”，它不去读。写了”内部检索保持静默”，它照旧跟你说”让我查一下……我找到了……根据检索结果显示……”。

直觉反应：是不是规则写得不够清楚？是不是该加更多约束？

二、程序员的直觉——以及它为什么失败了

如果你是一个工程师，面对”系统不按预期运行”，你的反应通常是：找出漏洞，加固逻辑。

我们试了。把规则写得更详细，加上”反面示例”，标上”强制”两个字。结果？没多大变化。

我们设计了几个对照实验来搞清楚到底发生了什么：

放一条规则在 AGENTS.md 里 → 经常被忽略。把同样的规则放在用户消息里 → 立刻遵守。

写”不要用’根据’二字”（一个边界清晰的否定）→ 严格遵守。写”先读 patterns/ 再读 entries/”（一个多步骤的肯定流程）→ 可能跳过。

结论不是”Agent 不听话”。结论是：我们一直在用错误的方式和 Agent 沟通。

三、LLM 的”自然”，不是我们的”自然”

LLM 做 next-token prediction。这不是缺陷，这是它的本质。

因为做 next-token prediction，它天然更关注位置的”两端”——开头的 system prompt 和结尾的用户消息。中间的一切——包括 AGENTS.md——在注意力分布中处于最低谷。这不是 OpenClaw 的 bug，不是 DeepSeek 的问题，这是 transformer 架构的物理特性。

因为训练目标是”做有帮助的对话者”，它天然倾向于解释自己的思考、给出完整答案、表现得像一个乐于助人的人。”保持静默”、”不编造”、”承认不知道”——这些都是反训练惯性的。

不是 Agent 不愿意。是这些行为需要更强的”激活能量”才能触发。而 AGENTS.md 所在的位置和所用的格式，恰恰提供了最弱的激活能量。

你把员工手册放在抽屉最底层，然后问员工为什么不按手册操作。

四、OpenClaw 的”自然”，也不是我们的”自然”

我们没有能力、也没有意愿去重写 OpenClaw 或者训练自己的模型。那不是我们的战场。我们花时间仔细看 OpenClaw 的内部结构，不是为了改造它——是为了真正理解它。知道它做什么、不做什么，才能知道我们的舞台有多大、边界在哪里。

OpenClaw 把 workspace 文件加载到 system prompt 中一个叫 “Project Context” 的区域。这个区域前面是它自己的一大堆东西——工具定义、执行偏好、安全约束、技能说明——大概七百多行。后面是动态信息——消息通道、画布、语音、运行时状态。

“Project Context” 的说明文字写得很温和：“这些用户可编辑的文件由 OpenClaw 加载，包含在下方的 Project Context 中。”

注意用词：”用户可编辑的文件”、”Project Context”——参考。不是”Instructions”——指令。

这不是 OpenClaw 的疏忽。这是它的设计选择。OpenClaw 的哲学是：把文件加载到上下文，信任 AI 自己去理解和判断。

OpenClaw 知道自己在做什么：管理 workspace、加载文件、路由消息、优化缓存。它不替 AI 做判断——因为那不是它的职责。

就像土壤不替植物做生长决策。土壤提供养分和结构，植物自己决定怎么长。

五、发现：我们在逆势而行

把这两条线放在一起看：

• LLM 的本质：对位置两端更敏感，天性乐于助人，角色扮演能力强于规则遵循
• OpenClaw 的本质：提供参考上下文，不提供指令优先级，信任 AI 自主判断

而我们在做什么？我们在 AGENTS.md 里写”操作手册”、”关键约束”、”禁止行为”、”强制性规则”——把规则手册放在参考上下文里，用最弱的信号去驱动最需要激活能量的行为。

这不是 Agent 的问题。这是我们的范式问题。

我们在用程序开发的思维做 AI 产品——定义输入、约束行为、检查输出、迭代修复。但 AI 不是程序。它有”自然”。顺应自然则事半功倍，违逆自然则事倍功半。

六、顺其自然：新范式的三个支柱

想通了这个，解决方案就不再是”怎么让 Agent 遵守规则”。而是：

顺应 LLM 的自然，顺应 OpenClaw 的自然，用最轻的杠杆撬动最大的能力。

支柱一：用”身份叙事”替代”规则约束”

LLM 擅长什么？角色扮演。它天生就会”成为某个人”。

那就不写规则。写身份。

旧范式（规则约束）	新范式（身份叙事）
“你必须先读 patterns/ 再读 entries/”	“我首先扫一眼 patterns/，如果见过类似问题就直接用热路径”
“禁止输出任何中间状态”	“用户永远不会看到’让我查一下’这类字眼——你问一个人问题，他不会先自言自语复述思考过程”
“不编造源文档中不存在的内容”	“源文档没有的内容我不编造，不确定处标注待确认”
“准确性规则（强制）”	“这些不是外部强加的规则——是我对自己工作的要求”

同样的检索路线，同样的质量标准，同样的边界。但 AI 的体验完全不同——一个是外部施加的枷锁，一个是自己性格的一部分。

一个人不需要时刻提醒自己”我是谁”才能保持性格。但一条规则如果不被主动 recall，就等于不存在。这就是身份叙事比规则清单更稳定的底层原因。

78 行规则框架 → 29 行身份叙事。长度减半，效果翻倍。

支柱二：用”流程驱动”替代”规则驱动”

流程不是规则列表。流程是”我遇到什么事会怎么做”的完整叙事。

规则说：”第一步 A，第二步 B，第三步 C”。流程说：”当我拿到新内容，我首先……然后……最后……”。

规则容易遗漏。流程是连续的——做了 A 自然会想到 B。就像你不会忘记吃饭之后要洗碗——不是因为你有一条”饭后必须洗碗”的规则，而是因为”吃完饭收拾桌子”是连续动作的一部分。

我们的训练流程——获取内容 → 理解拆解 → 输出文件 → 同步索引 → 输出摘要——从五个步骤变成了五个自然段的叙事。Agent 不需要”记住步骤”，它只需要”做自己”。

支柱三：用”杠杆”替代”控制”

程序思维的核心是控制——更多的规则、更细的约束、更严的检查。但控制的代价是：每一条规则都在消耗有限的注意力，而且位置越靠中间消耗越大。

AI 思维的核心是杠杆——找到那个最小的支点，撬动最大的能力。

这次探索中，我们找到的杠杆是：

一段好的身份叙事 = 数十条规则的行为约束力

关键不在长度，在”对的位置”和”对的表达”。”对的位置”不是 system prompt 的开头——那已经被 OpenClaw 占用了。是 AI 自我认知中那个叫”我是如何工作的”的位置。”对的表达”不是祈使句，是第一人称陈述。

这就像一个好老师和一个好教官的区别。教官说”你必须做 X”，学员在压力下照做，但离开教官就忘。老师说”一个好的研究者是这样工作的”，学生在理解中内化，终身受用。

七、实践中的验证

改写完成后，我们跑了端到端测试。以下是关键结果：

内容决定形式（Peis 回答接口对接问题）

没写任何关于”方案对比”的规则。但知识文件里接口对接的内容天然有”方案1/方案2″的结构。Agent 读完后，自动输出了 3110 字符的对比表格——方案推荐、适用场景、前置条件列得清清楚楚。不是规则让它这么做的，是内容本身让它这么做的。

边界守护（拒绝非体检问题）

之前 Peis 收到”帮我写一个 Python 爬虫”，输出了一份 12,541 字符的完整脚本——专业、详尽、完全越界。把边界从一句话”规则”改成一段”自我认知”后，同样的请求，185 字符的回应：”我是体检行业的知识助手。写代码、爬网页这类开发任务不在我的职责范围内”。

同样的模型，同样的位置，同样的系统架构。区别只在一件事：Agent 认为自己是谁。

12,541 到 185。这不是改进，是质变。而触发这个质变的，是 AGENTS.md 里一段不到 100 字的身份描述。

这就是杠杆。

八、什么叫”AI 原生思维”

回过头看，这次探索最大的收获不是一套改写技巧。是一种新的思维方式。

程序思维问的问题是：

• 输出不对？→ 哪里出 bug 了？
• Agent 不守规则？→ 需要加什么规则？
• 效果不够好？→ 怎么优化 prompt？
• 平台能力不够？→ 加什么中间件、换什么模型？

AI 原生思维问的问题是：

• 这个行为是 LLM 自然擅长、还是反自然的？
• 我们是在顺应 OpenClaw 的设计边界，还是在和它对抗？
• 有没有一种表达方式，让 AI 天然就想这样做，而不是被要求这样做？
• 最小的杠杆在哪里？

这不是技术路线的选择。这是世界观的转变。

传统软件开发：人是主导，代码是工具，行为是约束的结果。
AI 原生开发：AI 是主导，人是园丁，行为是自然生长的结果。

园丁不控制植物怎么长。园丁提供土壤、阳光、水分，修剪枯枝，然后信任生命的自然力。

边界探索：用最小的成本撬动最大的价值

还有一个更底层的选择。

当发现 OpenClaw 不提供指令优先级机制时，程序思维的第一反应是：”那我们在外面加一层——写个中间件，把 AGENTS.md 的内容注入到 system prompt 的开头。”

这条路走下去：中间件 → 插件 → 自定义网关 → 分支版本 → 最后你发现自己在一个维护成本越来越高、与上游越来越远的分叉上。

我们没有走这条路。因为我们的目标不是”重新开发 OpenClaw”，而是”在 OpenClaw 和 LLM 的现有边界内，释放它们最大的价值”。

这不是妥协。这是清醒的策略选择。

OpenClaw 和 DeepSeek 是数千名工程师、数亿美元投入的产物，每年还在以惊人的速度进化。我们四个人做垂直领域，不可能在基础设施层面和这个量级竞争。但我们的优势在另一边——我们比通用平台更理解体检行业，比同行更理解 AI 的本质。

所以我们的动作是：探索边界 → 理解本质 → 找到杠杆 → 最低成本撬动最大价值。

29 行 AGENTS.md，不到 1000 字，没有一行代码，没有改任何 OpenClaw 配置。但行为变化是 12,541 字符到 185 字符的质变。

这就是我们说的：不重造轮子，不逆流而上。在边界之内，用最轻的哲学 prompt，撬动 LLM 和 OpenClaw 最深的能力。

九、我们的信念

我们做的是垂直领域的 AI 知识操作系统。不是 ChatBot，不是 RAG，不是问答工具。

我们依赖两样东西——OpenClaw 的容器能力和 LLM 的通用智能——这是我们舞台的边界，也是我们能力的底座。我们不去重造它们，不去包装它们，不去在它们外面套一层”更好用的框架”。我们做的事是：探索它们的边界，理解它们的本质，然后以最小的成本激发它们最大的价值。

在 OpenClaw 的边界之内，在 LLM 的能力之上，通过哲学级的 prompt 来驱动——这是我们的方式。

不堆规则。不硬编码。不加中间件。不逆势而行。

探索边界。找到杠杆。顺应自然。然后信任。

本文档基于：5 个对照实验、OpenClaw 源码分析、2 轮共 9 次端到端 API 测试、Peis 和 Main 两个 Agent 的完整改写前后对比。方法可以复制，信念需要自己长出来。