小龙虾白皮书【2】WHAT OpenClaw到底是什么?
“Claude、DeepSeek 这些大模型是大脑,OpenClaw 是身体。”
大脑什么都懂,但没有身体就被困在浏览器窗口里。OpenClaw 给它装上:
没有手脚不能执行操作,没有眼睛看不到你的文件系统,没有耳朵听不到飞书上的消息,没有记忆本关掉窗口就忘了之前说的。它被困在一个小房间里(浏览器窗口),只能跟你说话。OpenClaw 做的事,就是给这个大脑装上一个完整的身体。
ChatGPT / Claude 和 OpenClaw 不是竞争关系,是协作关系。
OpenClaw 里面跑的就是 Claude / GPT / DeepSeek,它用它们当大脑,自己提供身体。
你不需要在”用 ChatGPT 还是用 OpenClaw”之间做选择,你可以同时用。
2.2 与 ChatGPT / Claude 的对比
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
整个文件系统 + git(代码版本管理工具)版本控制
|
ChatGPT 的自定义给你一个文本框写 system prompt(系统提示词),写完就是一个静态指令。OpenClaw 给你的是一整个文件系统:多个 Markdown(简单的文本标记格式)文件各司其职,可以随时编辑、版本控制、让 AI 自己更新。
比喻“ChatGPT 的定制是写一份固定的说明书,OpenClaw 的定制是给 AI 一本不断更新的活笔记。”
把 OpenClaw 想象成一家一人公司,AI 是唯一的员工:
① Gateway(网关):公司前台,端口 18789,挂了=全面罢工
② Channels(消息通道):沟通渠道,20+ 平台,国内推荐飞书
③ Skills(技能):技能证书,ClawHub 13,700+,本质是 Markdown
④ Memory(记忆):员工笔记本,MEMORY.md 持久,上下文↔文件调度
⑤ Heartbeat(心跳):巡检制度,定时醒来检查,从被动→主动
⑥ Workspace(工作区):灵魂四件套,AGENTS / SOUL、USER / MEMORY
Gateway(网关):跑在你机器上的服务程序,监听端口 18789,所有消息都经过它路由调度。它挂了 = 整个 AI”罢工”,什么消息都收不到,什么任务都执行不了。
Memory(记忆):把 LLM 的上下文窗口想象成电脑内存(RAM),把磁盘上的文件想象成硬盘。内存快但容量小(断电就没了),硬盘慢但永久保存。OpenClaw 不断在两者之间”调度”。
Heartbeat(心跳):这是从”被动”变”主动”的关键。设一个 HEARTBEAT.md 清单,AI 按时间间隔自己醒来检查 — 新邮件?HN(Hacker News,硅谷科技论坛)热帖?任务完成了?有情况就主动通知你。
Workspace(工作区):社区叫它 “Context Kernel”(上下文内核),每次 AI 开始新对话前都按固定流程加载 — 就像操作系统内核在任何程序运行前先加载一样。
你发一条”帮我写封邮件给客户”,AI 不只看到这 10 个字 — AGENTS.md 说”发邮件前必须确认”,SOUL.md 说”用简洁直接的风格”,USER.md 说”你是 AI 硬件产品经理”,MEMORY.md 说”上次这个客户关心交付时间”。同一句话,不同文件,完全不同的输出质量。
权限阶梯:AGENTS.md(人类锁定)> SOUL.md(AI 可改)> MEMORY.md(完全开放)
开机仪式:每次新对话启动时,AI 按固定流程加载文件 ↓
你可以在 AGENTS.md 里自定义这个启动流程,让 AI 每次”上班”都先做你要求的检查。
核心洞察“上下文 = 缓存,文件 = 真正的记忆。”
官方文档“OpenClaw 的每一个行为都可以追溯到磁盘上的一个文件。”
OpenClaw 内置 25+ 个工具:翻出”命令行”就能执行代码,翻出”浏览器”就能自动登录网站、填表、截图。
浏览器自动化最惊喜 — AI 像真人一样操作浏览器:打开网页、登录、填表、点击、截图。
MCP(Model Context Protocol)是 Anthropic 推的开放标准,像 USB 接口一样即插即用。
有了它,AI 不用为每个服务单独写适配器 — 连 Notion、数据库、Google Drive 即插即用。
-
-
-
-
-
-
-
-
AI 自己决定下一步做什么,可能搜天气、查日程、综合后再回复你。这种自主决策的循环就是 Agent 的核心。
了解完六个概念和消息流程,你可能会好奇:这些设计背后的原理是什么?
不是”你说一步我做一步”,而是”你说目标,我自己拆解、自己执行、自己检查”。
接到任务 → 思考拆解 → 选择工具 → 执行操作 → 检查结果 → (还没完成→回到思考拆解;完成了→)最终回复
AI 可能自己循环三次:搜天气 → 发现你日程里明天有户外会议 → 综合建议你穿什么、带不带伞
这就是 Agent(智能代理)和普通聊天机器人的本质区别。聊天机器人是”你问我答”,Agent 是”你给目标,我自己想办法达成”。
-
工作记忆(上下文窗口):容量有限,用完就忘,像你同时只能记住 7 个电话号码
-
长期记忆(磁盘文件):永久保存,但需要”回忆”过程,像你的笔记本,要翻才能看到
对话进行中 → 上下文快满了 → 触发 memoryFlush(记忆刷写) → AI 把重要信息写入文件 → 清理上下文 → 继续工作
生动比喻“就像学生在下课铃响之前,赶紧把笔记抄完。”
这就是为什么你的 AI 不会失忆,今天聊的事,下周它还记得。因为重要信息都被”抄”到了 MEMORY.md 里。
核心设计哲学:OpenClaw 的每一个行为,都可以追溯到磁盘上的一个文件。
-
可追溯:AI 为什么这么做?打开文件就知道,不用猜
-
可版本控制:用 Git(版本管理工具)记录每次修改,随时可以”回滚”到之前的状态
对比 ChatGPT:它的行为藏在”黑箱”里,你不知道它为什么突然变了风格。OpenClaw 的一切行为都写在文件里,透明可控。
官方设计理念“不是黑箱,不是玄学,它怎么做事,完全由你写在文件里的内容决定。”