认识OpenClaw小龙虾

一、为什么应该关注 OpenClaw？

1.1 建立兴趣的理由

OpenClaw 的爽文男主剧本

GitHub 历史第一：三个月飙到 245,119 星标，超越存在 40 年的 Linux，成为开源史上增长最快项目
OpenAI 收购创始人 → OpenAI 股价暴涨 15%，Anthropic 跌 8%，Google 紧急调整 Android 17 战略
国内外大厂集体跟进，冲击 SaaS 市场（软件开发、客服、市场调研等全行业）
直接导致苹果 Mac Mini 缺货、Mac Studio 高内存版交付从 14 天拉长到 54 天——一个开源项目把苹果电脑买断货

顶级背书

Andrej Karpathy（前特斯拉 AI 总监）：“这是我见过最接近科幻起飞的东西。”

Elon Musk 转发

Fortune 杂志：“当下互联网最有趣的东西”

1.2 Peter Steinberger 的故事：从 PDF 王者到 OpenClaw 缔造者

背景：奥地利人，花13年打造 PDF 编辑公司 PSPDFKit，最终以超过1亿美元出售。
转折与低谷

卖掉公司后陷入人生低谷。

用 AI 仅花1小时写了个小工具，竟基本能替代他13年心血的产品——巨大冲击，让他一度迷茫。

-2025年重燃

AI 浪潮让他重新兴奋，all in（全力押注）。

半年内疯狂做了43个项目，每一个失败都在帮他搞清楚“AI 擅长什么、不擅长什么”。

没有前43次的试错，就没有第44个项目的爆发：OpenClaw。

-标志性 Aha Moment（语音消息事件）

Peter 随手给 AI 发了一条语音消息（他从未编程让 AI 处理语音）。

Agent 自己完成全流程：

检测语音格式
搜索并找到合适的转文字工具
定位 API 凭证
自动调用完成转文字

Peter 原话：

“I literally went, 'How the f--- did he do that?'”

（我当时直接懵了：他到底是怎么做到的？！）

-核心洞察

Agent ≠ 单纯执行预设程序

Agent = 自己想办法、自己找路径、自己解决问题

1.3 关键转折点：从“聊天”到“行动”

2025年：AI聊天时代

打开ChatGPT/Claude网页 → 打字提问 → AI回答 → 关浏览器 → 结束
纯问答模式：你问，它答。

2026年：AI Agent时代

新物种AI Agent出现，三大根本区别：

自主决策：给目标，它自己规划路径
执行操作：不只聊天，能跑命令、发邮件、操作文件、浏览网页
持久运行：7×24在线，定时主动醒来干活

ACI vs AGI

大家热议AGI（通用人工智能），但OpenClaw真正做的是ACI（Agent-Computer Interface，代理-计算机接口）——让AI真正帮人把事办了。

我们需要的不是聊天天才，而是能干活的“AI经理人”。

范式彻底翻转

过去：人类学操作工具

现在：AI替人类操作工具

整个软件生态正在被重新定义。

OpenClaw的定位

没发明Agent概念（学术界研究多年）
但它踩准时间点，做到了：开源 + 本地优先 + 人人都能拥有完全私有的Agent
“这不是更聪明的聊天机器人，这是真正的AI员工。”

改名历史（三个月三名字）：

Clawdbot → Moltbot → OpenClaw

一句话总结：

2026年AI从“会聊天”进化到“会干活”，OpenClaw开源本地Agent让每个人拥有24/7的私人AI员工，标志着从聊天时代到行动时代的真正转折。

二、OpenClaw到底是什么？

2.1 一个类比讲清本质

“Claude、DeepSeek 这些大模型是大脑，OpenClaw 是身体。”

大脑什么都懂，但没身体就被困在浏览器窗口里，只能聊天。

OpenClaw 给它装上完整身体：

眼睛：浏览网页、读取文件
耳朵：监听 20+ 平台消息（WhatsApp、Telegram、飞书等）
手：执行命令、发邮件、操作电脑
笔记本：持久记忆（关窗口也不忘）
闹钟：定时主动醒来干活

没有这些，大脑就被困在小房间，只能跟你说话。

OpenClaw 的本质：给大模型装上能真正“做事”的身体。

ChatGPT/Claude 和 OpenClaw 不是竞争，而是协作

OpenClaw 里面跑的就是 Claude/GPT/DeepSeek，它们当大脑，OpenClaw 提供身体。

你不需要二选一，完全可以同时用：大脑思考 + 身体执行。

2.2 与 ChatGPT / Claude 的对比

很多人忽略的关键差异：

ChatGPT / Claude 的自定义

给你一个文本框写 system prompt，写完就是一份静态指令，固定不变。

OpenClaw 的自定义

给你一整个文件系统：多个 Markdown 文件各司其职（身份、行为规范、记忆、工具、习惯等），可以随时手动编辑、版本控制、让 AI 自己更新内容。

比喻

ChatGPT 的定制 = 写一份固定的说明书

OpenClaw 的定制 = 给 AI 一本不断更新的活笔记

2.3 六个核心概念

把 OpenClaw 想象成一家一人公司，AI 是唯一的员工

①Gateway（网关）

公司前台，监听端口 18789。

所有消息路由都经过它，挂了 = 全面罢工（收不到消息、执行不了任务）。

②Channels（消息通道）

沟通渠道，支持 20+ 平台（Telegram、WhatsApp、飞书等）。

国内推荐用飞书。

③Skills（技能）

技能证书，本质是 Markdown 文件（.md）。

ClawHub 上已有 13,700+ 个可共享技能。

④Memory（记忆）

员工笔记本。

核心文件 MEMORY.md 实现持久存储。

上下文（RAM，临时快但小） ↔ 文件（硬盘，慢但永久）的动态调度。

⑤Heartbeat（心跳）

巡检制度，让 AI 从被动变主动。

每固定间隔自动醒来，读 HEARTBEAT.md 或 habit.md 检查：新邮件？任务进度？HN 热帖？有事就主动通知你。

⑥Workspace（工作区 / Context Kernel）

灵魂四件套，每次新对话启动前固定加载，像操作系统内核：

AGENTS.md→ 员工手册（铁律，人类锁定，不可改）

SOUL.md→ 灵魂/人格（可成长，AI 可自己更新）

USER.md→ 你的画像/角色设定

MEMORY.md→ 工作笔记/长期记忆

权限阶梯：AGENTS.md > SOUL.md > MEMORY.md

邮件场景示例

你说“帮我写封邮件给客户”，AI 实际加载：

AGENTS.md（发邮件前必须确认） + SOUL.md（用简洁直接风格） + USER.md（你是 AI 硬件产品经理） + MEMORY.md（上次客户关心交付时间）

→ 同一句话，输出质量天差地别。

开机仪式

新对话启动 → 按固定流程加载四文件 → 可在 AGENTS.md 自定义启动检查清单。

核心洞察

上下文 = 缓存（临时）

文件 = 真正的记忆（永久）

“OpenClaw 的每一个行为都可以追溯到磁盘上的一个文件。”

官方文档

"OpenClaw 的每一个行为都可以追溯到磁盘上的一个文件。"

额外两个迟早会碰到的概念

⑦Tools（工具）

瑞士军刀，内置 25+ 个：命令行执行、浏览器自动化（像真人一样打开网页、登录、填表、点击、截图）。

⑧MCP（Model Context Protocol）

Anthropic 推的开放标准，像 USB 接口。

让 AI 即插即用连接 Notion、Google Drive、数据库等，无需单独适配。

2.4 一条消息的旅程

Agentic Loop（代理循环）

AI 自己决定下一步做什么，可能搜天气、查日程、综合后再回复你。这种自主决策的循环就是 Agent 的核心。

2.5 三个核心原理：它为什么这样设计？

原理一：Agentic Loop（代理循环）

类比：自驱型员工的工作方式

不是“你说一步我做一步”，而是“你给目标，我自己拆解、执行、检查、迭代”。

例子：你说“帮我查明天北京天气”

→ AI 可能循环多次：查天气 → 读你日程（明天有户外会议） → 综合建议穿什么、带伞

核心区别：聊天机器人是“问答”，Agent 是“目标驱动，自己想办法达成”。

原理二：双层记忆调度

类比：人的大脑（工作记忆 vs 长期记忆）

工作记忆（上下文窗口）：容量小、临时、用完就忘（像同时记7个电话号码）

长期记忆（磁盘文件）：永久保存，但需“回忆”过程（像翻笔记本）

OpenClaw 做法：

对话中把重要信息“抄”到 MEMORY.md 文件里。

下周再聊，它从文件里拉回相关记忆，不会失忆。

生动比喻：“就像学生下课铃响前赶紧把笔记抄完。”

原理三：文件驱动架构

类比：公司制度手册（不是口头约定）

核心哲学：OpenClaw 每一个行为都可追溯到磁盘上的一个文件。

三大优势：

可追溯：AI 为什么这么做？打开文件就知道，不用猜

可版本控制：用 Git 记录每次修改，随时回滚

可调试：输出不对？直接改文件，不用重训模型

对比 ChatGPT：行为藏在黑箱里，不知为何突然变风格。

OpenClaw：一切由你写在文件里的内容决定，透明、可控、非玄学。

三、它能做什么？真实案例 + 场景价值

核心价值：帮你省时间，把重复、低价值劳动自动化。

“概念听一百遍不如案例看一遍。”以下四个真实用户常用场景，每个拆解“用了哪些模块”，方便举一反三。

3.1 办公提效

早间简报（社区最热门入门用法）

每天早7点自动：搜集新闻 → 提炼5条摘要 → 发到飞书

用了哪些模块：Heartbeat定时触发 + 搜索Skill + 消息投递Channel

用户反馈：“以前每天刷新闻30分钟，现在30秒看完。”

三合一精髓：定时 + 主动 + 个性化（MEMORY.md记住你关心的领域）

智能提醒（任务完成主动打电话）

示例指令：“整理完报告后打电话通知我” / “公众号排完版了打电话叫我审核”

不是设闹钟到点响，而是AI自己判断任务完成 → 直接拨打你手机

价值：备忘录常漏看，电话你总会接

用了哪些模块：Heartbeat/Cron判断完成 + execute工具打电话

会议纪要自动化

开完会 → 把录音发给AI → 自动转文字 + 提取结论 & action items → 发给相关人

用了哪些模块：Channel接收文件 + 语音转文字Skill + 结构化输出Skill

价值：从1小时手动整理 → 几分钟自动完成

日报/周报半自动化

AI根据当天飞书消息 + 工作记录，自动草拟日报框架 → 你只需2分钟改几个字

用了哪些模块：Heartbeat定时触发 + Memory记录工作上下文

其他扩展：自动整理报销单据、出差行程规划

3.2 自媒体提效

核心价值：把自媒体从“手工苦力”变成“AI 流水线”，一人带队干一个团队的活。

公众号一键排版

3000字长文 → 发给AI → 3分钟出精美排版 → 直接粘贴到公众号后台发布

用了哪些模块：Skill调用排版模板 + MEMORY.md记住你的风格偏好（字体、间距、配图习惯等）

价值：从1小时手动调格式 → 几分钟一键搞定

小红书内容批量生成

一篇长文 → 5分钟自动拆成5条图文笔记 → 自动配标题、标签、小红书风格 → 发到你手机待审核/发布

用了哪些模块：内容拆解Skill + SOUL.md定义你的内容调性（文艺/干货/种草等）

短视频文案流水线

给一个选题 → AI一键生成：完整脚本 + 分镜描述 + 字幕文案 + 口播建议

你只管拍和剪辑

用了哪些模块：多Skill串联（脚本生成→分镜拆分→字幕优化） + MEMORY.md记录哪类选题数据表现好

越用越聪明的机制

不是模型突然变聪明，而是经验被系统化记录到 MEMORY.md：

哪类标题点击率高

哪种排版转发多

读者偏好哪些开头/结尾

AI 通过这些积累，越来越懂你的受众和平台算法。

用户真实反馈

“以前一个人干三个人的活，现在是一个人带着AI干一个团队的活。”

3.3 团队协作提效

4000封邮件两天处理完

出差两周积压4000封邮件 → AI两天内完成：自动分类、退订垃圾邮件、起草回复（供人工审核）

用了哪些模块：Channel接收邮件 + 分类Skill + MEMORY.md记住常用联系人/风格/历史回复习惯

价值：从几周手动处理 → 两天自动化完成

团队站会自动化

每天下班前收集队员blockers → 早上自动汇总飞书+项目管理工具 → 生成站会简报

用了哪些模块：Heartbeat定时触发 + 多Channel数据聚合 + 结构化输出Skill

3.4 “骚操作”

AI自己给自己写Skill

你让它做一件没对应能力的事 → AI发现缺Skill → 自己写.md文件 → 自己读取安装 → 自己完成任务

本质：相当于员工自己去学新技能、学完直接上手干活

AI自己判断该做什么

你只说了一句“帮我想想办法” → AI：

关键：没让你说“去验证”，它自己觉得“光整理不够，得试过才靠谱”

→ 主动找活干、主动验证、主动迭代