小龙虾白皮书【2】WHAT OpenClaw到底是什么?-夜雨聆风

小龙虾白皮书【2】WHAT OpenClaw到底是什么?

WHAT

OpenClaw 到底是什么？

核心概念

搞清楚六个概念，后面所有用法都是它们的排列组合。

2.1 一个类比讲清本质

5 min

“Claude、DeepSeek 这些大模型是大脑，OpenClaw 是身体。”

大脑什么都懂，但没有身体就被困在浏览器窗口里。OpenClaw 给它装上：

眼睛：浏览网页、读取文件

耳朵：20+ 平台、消息接收

手：跑命令、发邮件

笔记本：持久记忆、不会忘

闹钟：定时醒来、主动干活

没有手脚不能执行操作，没有眼睛看不到你的文件系统，没有耳朵听不到飞书上的消息，没有记忆本关掉窗口就忘了之前说的。它被困在一个小房间里（浏览器窗口），只能跟你说话。OpenClaw 做的事，就是给这个大脑装上一个完整的身体。

ChatGPT / Claude 和 OpenClaw 不是竞争关系，是协作关系。

OpenClaw 里面跑的就是 Claude / GPT / DeepSeek，它用它们当大脑，自己提供身体。

你不需要在”用 ChatGPT 还是用 OpenClaw”之间做选择，你可以同时用。

2.2 与 ChatGPT / Claude 的对比

维度	ChatGPT / Claude	OpenClaw
本质	AI 大模型	编排层，用大模型作大脑
交互	浏览器 / App	飞书、Telegram、WhatsApp…
在线	关窗口就没了	7×24 不关机
能力	对话框说话	+ 跑命令 + 发邮件 + 操作文件
记忆	对话结束即忘	文件持久保存
主动性	你问它才答	定时检查，主动汇报
数据	在它们服务器	在你自己机器上
费用	$20+/月订阅	软件免费，付 API 费
定制	一个文本框	整个文件系统 + git（代码版本管理工具）版本控制

很多人忽略的关键差异

ChatGPT 的自定义给你一个文本框写 system prompt（系统提示词），写完就是一个静态指令。OpenClaw 给你的是一整个文件系统：多个 Markdown（简单的文本标记格式）文件各司其职，可以随时编辑、版本控制、让 AI 自己更新。

比喻“ChatGPT 的定制是写一份固定的说明书，OpenClaw 的定制是给 AI 一本不断更新的活笔记。”

2.3 六个核心概念

8 min · 重点

把 OpenClaw 想象成一家一人公司，AI 是唯一的员工：

① Gateway（网关）：公司前台，端口 18789，挂了=全面罢工

② Channels（消息通道）：沟通渠道，20+ 平台，国内推荐飞书

③ Skills（技能）：技能证书，ClawHub 13,700+，本质是 Markdown

④ Memory（记忆）：员工笔记本，MEMORY.md 持久，上下文↔文件调度

⑤ Heartbeat（心跳）：巡检制度，定时醒来检查，从被动→主动

⑥ Workspace（工作区）：灵魂四件套，AGENTS / SOUL、USER / MEMORY

Gateway（网关）：跑在你机器上的服务程序，监听端口 18789，所有消息都经过它路由调度。它挂了 = 整个 AI”罢工”，什么消息都收不到，什么任务都执行不了。

Memory（记忆）：把 LLM 的上下文窗口想象成电脑内存（RAM），把磁盘上的文件想象成硬盘。内存快但容量小（断电就没了），硬盘慢但永久保存。OpenClaw 不断在两者之间”调度”。

Heartbeat（心跳）：这是从”被动”变”主动”的关键。设一个 HEARTBEAT.md 清单，AI 按时间间隔自己醒来检查 — 新邮件？HN（Hacker News，硅谷科技论坛）热帖？任务完成了？有情况就主动通知你。

Workspace（工作区）：社区叫它 “Context Kernel”（上下文内核），每次 AI 开始新对话前都按固定流程加载 — 就像操作系统内核在任何程序运行前先加载一样。

邮件场景的四文件协作 ↓

你发一条”帮我写封邮件给客户”，AI 不只看到这 10 个字 — AGENTS.md 说”发邮件前必须确认”，SOUL.md 说”用简洁直接的风格”，USER.md 说”你是 AI 硬件产品经理”，MEMORY.md 说”上次这个客户关心交付时间”。同一句话，不同文件，完全不同的输出质量。

Workspace（工作区）展开：灵魂四件套

AGENTS.md → 员工手册（铁律）

SOUL.md → 灵魂（可成长）

USER.md → 你的画像

MEMORY.md → 工作笔记

权限阶梯：AGENTS.md（人类锁定）> SOUL.md（AI 可改）> MEMORY.md（完全开放）

开机仪式：每次新对话启动时，AI 按固定流程加载文件 ↓

AGENTS.md

SOUL.md

USER.md

今天/昨天日记

MEMORY.md

准备就绪

你可以在 AGENTS.md 里自定义这个启动流程，让 AI 每次”上班”都先做你要求的检查。

核心洞察“上下文 = 缓存，文件 = 真正的记忆。”

官方文档“OpenClaw 的每一个行为都可以追溯到磁盘上的一个文件。”

文件	作用	关注度
AGENTS.md	操作规则（所有会话）	✅ 核心
SOUL.md	AI 性格（主会话）	✅ 核心
USER.md	用户画像（主会话）	✅ 核心
MEMORY.md	永久记忆（主私聊）	✅ 核心
IDENTITY.md	防注入锚点	进阶
TOOLS.md	工具使用规则	进阶
HEARTBEAT.md	定时检查清单	进阶
BOOT.md	重启时执行	进阶
SHIELD.md	安全策略	进阶
memory/*.md	每日日志（自动写）	自动
skills/*.md	技能定义	按需

再多说两个你迟早会碰到的概念：

⑦ Tools（工具）：瑞士军刀

OpenClaw 内置 25+ 个工具：翻出”命令行”就能执行代码，翻出”浏览器”就能自动登录网站、填表、截图。

浏览器自动化最惊喜 — AI 像真人一样操作浏览器：打开网页、登录、填表、点击、截图。

⑧ MCP：万能钥匙

MCP（Model Context Protocol）是 Anthropic 推的开放标准，像 USB 接口一样即插即用。

有了它，AI 不用为每个服务单独写适配器 — 连 Notion、数据库、Google Drive 即插即用。

起步阶段不用深究，知道有这个东西就行。

2.4 一条消息的旅程

你在手机打字
飞书传给OpenClaw
Gateway路由
加载四文件+Skills
AI大脑决策
执行工具
整理答案
手机弹通知

Agentic Loop（代理循环）

AI 自己决定下一步做什么，可能搜天气、查日程、综合后再回复你。这种自主决策的循环就是 Agent 的核心。

2.5 三个核心原理：它为什么这样设计？

5 min · 进阶理解

了解完六个概念和消息流程，你可能会好奇：这些设计背后的原理是什么？

三个原理，用三个生活类比讲清楚。

原理一：Agentic Loop（代理循环）

类比：像一个自驱型员工的工作方式

不是”你说一步我做一步”，而是”你说目标，我自己拆解、自己执行、自己检查”。

代理循环的工作方式 ↓

接到任务 → 思考拆解 → 选择工具 → 执行操作 → 检查结果 → （还没完成→回到思考拆解；完成了→）最终回复

举个例子：你说”帮我查明天北京天气”

AI 可能自己循环三次：搜天气 → 发现你日程里明天有户外会议 → 综合建议你穿什么、带不带伞

核心区别

这就是 Agent（智能代理）和普通聊天机器人的本质区别。聊天机器人是”你问我答”，Agent 是”你给目标，我自己想办法达成”。

原理二：双层记忆调度

类比：像人的大脑，工作记忆 vs 长期记忆

工作记忆（上下文窗口）：容量有限，用完就忘，像你同时只能记住 7 个电话号码

长期记忆（磁盘文件）：永久保存，但需要”回忆”过程，像你的笔记本，要翻才能看到

OpenClaw 的记忆调度流程 ↓

对话进行中 → 上下文快满了 → 触发 memoryFlush（记忆刷写） → AI 把重要信息写入文件 → 清理上下文 → 继续工作

生动比喻“就像学生在下课铃响之前，赶紧把笔记抄完。”

这就是为什么你的 AI 不会失忆，今天聊的事，下周它还记得。因为重要信息都被”抄”到了 MEMORY.md 里。

原理三：文件驱动架构

类比：像一家公司的制度手册，不是口头约定

核心设计哲学：OpenClaw 的每一个行为，都可以追溯到磁盘上的一个文件。

可追溯：AI 为什么这么做？打开文件就知道，不用猜

可版本控制：用 Git（版本管理工具）记录每次修改，随时可以”回滚”到之前的状态

可调试：输出不对？改文件就行，不用重新训练模型

对比 ChatGPT：它的行为藏在”黑箱”里，你不知道它为什么突然变了风格。OpenClaw 的一切行为都写在文件里，透明可控。

官方设计理念“不是黑箱，不是玄学，它怎么做事，完全由你写在文件里的内容决定。”