OpenClaw 架构设计哲学:从 Prompt 到 Harness 的三层工程范式大家好,我是玄姐。
PS:
Hermes 架构干货直播,欢迎点击预约,直播见。
2026 年初,OpenClaw 彻底出圈,在技术圈乃至大众层面掀起了一场“全民养虾(🦞)热”。但在各种“跑通 Demo”和“安装攻略”的狂欢背后,我们更应该冷静下来,透过源码去剖析这只“小龙虾”的骨架。OpenClaw 并非凭空诞生的全新物种,而是近年来 Agent 关键技术的集大成者。它将动态 Prompt、上下文压缩、记忆管理、渐进式技能、Hook 机制以及端侧(Computer Use)的安全控制进行了系统性升华。本文将跳出繁琐的前后端工程实现,直接切入现代 AI 系统的三大核心阶段:Prompt Engineering(怎么说)、Context Engineering(看什么)、Harness Engineering(在哪跑),探讨如何将这些经过验证的设计哲学应用到企业级 Agent 和业务落地中。维度一:Prompt Engineering 从静态文本到动态组装
在 2023 年,写 Prompt 还是“小作文”大赛;但在 2026 年的成熟 Agent 系统中,Prompt Engineering 已经演变成了一套复杂的结构化动态组装机制。1. 像搭积木一样拼装 System Prompt
OpenClaw 不再使用硬编码的静态提示词,而是基于数十个参数、分为 23 个独立模块进行动态拼接。系统会根据场景(完整模式、精简模式、极简模式)决定加载哪些模块。- 绝对核心:身份标识(你是谁)、运行时环境(系统信息)。
- 动态加载:工具清单、安全红线(“思想钢印”:不越权、不泄密、服从人类)、文件沙箱路径。
- 条件注入:如果系统有记忆工具,才加载“记忆召回”规则;如果用户处于群聊,才加载“表情回复”策略。
2. Markdown 驱动的文件注入机制
这是 OpenClaw 最精妙的设计之一:将核心设定从代码中解耦,用 Markdown 文件管理,并通过文件系统动态读取注入。这种方式不仅利于版本控制,还极其方便解析。- AGENT.md(总纲):定义了 Agent 的底层行为逻辑,比如“好记性不如烂笔头(Text > Brain)”,以及在群聊中“重质量而非数量(Quality > quantity)”的发言规则。
- SOUL.md(灵魂):这是赋予 AI “人设”的关键小传。它规定了 Agent 的性格、语气和价值观,确保每个 OpenClaw 实例都能千人千面。
- USER.md(主人):记录用户的偏好、时区和习惯。
- TOOLS.md(兵器谱):记录当前环境下的定制化工具配置(如特定的 SSH 地址、摄像头名称)。
- HEARTBEAT.md(心跳任务):赋予 Agent “主动意识”,定义它在后台闲置时该去巡检什么(邮件、日历等)。
3. 极简主义:质量大于数量
在 Prompt 措辞上,OpenClaw 摒弃了冗长的条件声明,用词极为干练。例如,用一句 Ask anything you're uncertain about 替代复杂的异常处理说明。这种极简风格不仅让大模型遵循得更好,更重要的是为业务数据省出了极其宝贵的 Token 空间。维度二:Context Engineering 扩展、压缩与记忆
Prompt 决定了 Agent 的智商,而 Context 决定了它能处理多复杂的任务。Context Engineering 的核心难题是:如何对抗上下文窗口爆炸与“Lost in the Middle(中间遗忘)”现象?1. 渐进式披露的 Skills 机制
为了避免一次性塞入所有能力导致 Token 爆炸,OpenClaw 采用了按需加载的思路。默认只保留基础工具,当大模型判断需要特定能力时,才会去读取对应的 SKILL.md。这赋予了 Agent 近乎无限的能力边界,同时保持了轻量级的上下文。2. 上下文压缩(Compaction)与修剪(Pruning)
一场长对话就像一场开卷考试,你不能把整本书带进考场,必须学会提炼知识。注:OpenClaw 的压缩算法设计了极强的兜底逻辑,包括自适应分块、多阶段摘要,甚至在超时或失败时会返回默认的安全文本,以确保业务主流程不断裂。3. 抵抗“失忆”的双层 Memory 系统
为了防止大模型“睡一觉就忘”,OpenClaw 构建了长短结合的记忆引擎,并通过 BM25 + 向量检索实现精准召回。维度三:Harness Engineering 约束与引导控制
如果 Agent 是一匹千里马,Prompt 是告诉它去哪,Context 是给它看地图,那么Harness Engineering(脚手架/驾驭工程)就是给它套上马具。它通过外部机制约束大模型的“野性”,防止其跑偏或失控。1. Harness 与 Workflow 的本质区别
许多人容易混淆这两个概念。它们的根本分歧在于主导权在谁手里:- Workflow(业务流):主导权在“人”。开发者画好固定的流程图(A -> B -> C),大模型只是流水线上的操作工。优点是极度可控,缺点是毫无变通能力,遇错即崩。
- Harness(驾驭网):主导权在“AI”。大模型依然自主规划路径、调用工具、自我反思。但框架在四周拉起了护栏(比如必须先测试再提交、必须符合某类格式)。这是一种“软约束”,旨在让 AI 带着镣铐跳出最美的舞。
2. 全生命周期的 Hook 机制
OpenClaw 允许开发者在 Agent 运行的关键节点“插桩”。例如:- before_tool_call:拦截并校验模型生成的参数。如果模型瞎编了一个非法的实例 ID,Hook 可以直接将其打回并报错,迫使模型自我纠正,而不是让错误流转到真实的服务器环境。
- after_tool_call:对敏感数据进行脱敏后处理。
3. 纵深防御的安全沙箱
在允许大模型操作本地电脑(Computer Use)的场景下,安全是重中之重。OpenClaw 构建了三层防护:- 文件沙箱:将大模型死死锁在指定的 Workspace 目录,禁止越界访问系统根目录。
- 命令沙箱:通过白名单限制可执行的 Shell 命令。涉及高危操作时,强制熔断并触发“Ask 模式”,要求人类介入审批(Human-in-the-Loop)。
- 网络沙箱:严控数据出口,防止恶意 Skills 或被 Prompt 注入后私自将用户隐私数据外发。
结语
OpenClaw 的迭代仍在狂奔,但对我们而言,跟风体验只是皮毛。真正的价值在于将其设计理念“化为己用”:不要照搬形态,要提取方法。特别是在 To B 的企业级应用中,我们更需要 OpenClaw 这种通过模块化 Prompt 控制发散、通过双层 Memory 和智能压缩对抗 Token 焦虑、通过严密的 Harness 机制保障执行确定性的系统架构能力。这才是让通用大模型真正能下地干活的核心密码。PS:
Hermes 架构干货直播,欢迎点击预约,直播见。
—1—
加我微信
扫码加我👇有很多不方便公开发公众号的我会直接分享在朋友圈,欢迎你扫码加我个人微信来看👇
加星标★,不错过每一次更新!
⬇戳”阅读原文“,立即预约!