乐于分享
好东西不私藏

认识OpenClaw小龙虾

认识OpenClaw小龙虾

一、为什么应该关注 OpenClaw?

1.1 建立兴趣的理由

OpenClaw 的爽文男主剧本

  • GitHub 历史第一:三个月飙到 245,119 星标,超越存在 40 年的 Linux,成为开源史上增长最快项目
  • OpenAI 收购创始人 → OpenAI 股价暴涨 15%,Anthropic 跌 8%,Google 紧急调整 Android 17 战略
  • 国内外大厂集体跟进,冲击 SaaS 市场(软件开发、客服、市场调研等全行业)
  • 直接导致苹果 Mac Mini 缺货、Mac Studio 高内存版交付从 14 天拉长到 54 天——一个开源项目把苹果电脑买断货

顶级背书

Andrej Karpathy(前特斯拉 AI 总监):“这是我见过最接近科幻起飞的东西。”
Elon Musk 转发
Fortune 杂志:“当下互联网最有趣的东西”

1.2 Peter Steinberger 的故事:从 PDF 王者到 OpenClaw 缔造者

  • 背景:奥地利人,花13年打造 PDF 编辑公司 PSPDFKit,最终以超过1亿美元出售。
  • 转折与低谷
卖掉公司后陷入人生低谷。
用 AI 仅花1小时写了个小工具,竟基本能替代他13年心血的产品——巨大冲击,让他一度迷茫。

-2025年重燃

AI 浪潮让他重新兴奋,all in(全力押注)。
半年内疯狂做了43个项目,每一个失败都在帮他搞清楚“AI 擅长什么、不擅长什么”。
没有前43次的试错,就没有第44个项目的爆发:OpenClaw。

-标志性 Aha Moment(语音消息事件)

Peter 随手给 AI 发了一条语音消息(他从未编程让 AI 处理语音)。
Agent 自己完成全流程:
  • 检测语音格式
  • 搜索并找到合适的转文字工具
  • 定位 API 凭证
  • 自动调用完成转文字
Peter 原话:
“I literally went, 'How the f--- did he do that?'”
(我当时直接懵了:他到底是怎么做到的?!)

-核心洞察

Agent ≠ 单纯执行预设程序
Agent = 自己想办法、自己找路径、自己解决问题

1.3 关键转折点:从“聊天”到“行动”

2025年:AI聊天时代
  • 打开ChatGPT/Claude网页 → 打字提问 → AI回答 → 关浏览器 → 结束
  • 纯问答模式:你问,它答。
2026年:AI Agent时代
新物种AI Agent出现,三大根本区别:
  • 自主决策:给目标,它自己规划路径
  • 执行操作:不只聊天,能跑命令、发邮件、操作文件、浏览网页
  • 持久运行:7×24在线,定时主动醒来干活

ACI vs AGI

大家热议AGI(通用人工智能),但OpenClaw真正做的是ACI(Agent-Computer Interface,代理-计算机接口)——让AI真正帮人把事办了。
我们需要的不是聊天天才,而是能干活的“AI经理人”。

范式彻底翻转

过去:人类学操作工具
现在:AI替人类操作工具
整个软件生态正在被重新定义。

OpenClaw的定位

  • 没发明Agent概念(学术界研究多年)
  • 但它踩准时间点,做到了:开源 + 本地优先 + 人人都能拥有完全私有的Agent
  • “这不是更聪明的聊天机器人,这是真正的AI员工。”
改名历史(三个月三名字):
Clawdbot → Moltbot → OpenClaw
一句话总结:
2026年AI从“会聊天”进化到“会干活”,OpenClaw开源本地Agent让每个人拥有24/7的私人AI员工,标志着从聊天时代到行动时代的真正转折。

二、OpenClaw到底是什么?

2.1 一个类比讲清本质

“Claude、DeepSeek 这些大模型是大脑,OpenClaw 是身体。”
大脑什么都懂,但没身体就被困在浏览器窗口里,只能聊天。
OpenClaw 给它装上完整身体:
  • 眼睛:浏览网页、读取文件
  • 耳朵:监听 20+ 平台消息(WhatsApp、Telegram、飞书等)
  • 手:执行命令、发邮件、操作电脑
  • 笔记本:持久记忆(关窗口也不忘)
  • 闹钟:定时主动醒来干活
没有这些,大脑就被困在小房间,只能跟你说话。
OpenClaw 的本质:给大模型装上能真正“做事”的身体。
ChatGPT/Claude 和 OpenClaw 不是竞争,而是协作
OpenClaw 里面跑的就是 Claude/GPT/DeepSeek,它们当大脑,OpenClaw 提供身体。
你不需要二选一,完全可以同时用:大脑思考 + 身体执行。

2.2 与 ChatGPT / Claude 的对比

很多人忽略的关键差异:
ChatGPT / Claude 的自定义
给你一个文本框写 system prompt,写完就是一份静态指令,固定不变。
OpenClaw 的自定义
给你一整个文件系统:多个 Markdown 文件各司其职(身份、行为规范、记忆、工具、习惯等),可以随时手动编辑、版本控制、让 AI 自己更新内容。
比喻
ChatGPT 的定制 = 写一份固定的说明书
OpenClaw 的定制 = 给 AI 一本不断更新的活笔记

2.3 六个核心概念

把 OpenClaw 想象成一家一人公司,AI 是唯一的员工

①Gateway(网关)

公司前台,监听端口 18789。
所有消息路由都经过它,挂了 = 全面罢工(收不到消息、执行不了任务)。

②Channels(消息通道)

沟通渠道,支持 20+ 平台(Telegram、WhatsApp、飞书等)。
国内推荐用飞书。

③Skills(技能)

技能证书,本质是 Markdown 文件(.md)。
ClawHub 上已有 13,700+ 个可共享技能。

④Memory(记忆)

员工笔记本。
核心文件 MEMORY.md 实现持久存储。
上下文(RAM,临时快但小) ↔ 文件(硬盘,慢但永久)的动态调度。

⑤Heartbeat(心跳)

巡检制度,让 AI 从被动变主动。
每固定间隔自动醒来,读 HEARTBEAT.md 或 habit.md 检查:新邮件?任务进度?HN 热帖?有事就主动通知你。

⑥Workspace(工作区 / Context Kernel

灵魂四件套,每次新对话启动前固定加载,像操作系统内核:
AGENTS.md→ 员工手册(铁律,人类锁定,不可改)
SOUL.md→ 灵魂/人格(可成长,AI 可自己更新)
USER.md→ 你的画像/角色设定
MEMORY.md→ 工作笔记/长期记忆
权限阶梯:AGENTS.md > SOUL.md > MEMORY.md

邮件场景示例

你说“帮我写封邮件给客户”,AI 实际加载:
AGENTS.md(发邮件前必须确认) + SOUL.md(用简洁直接风格) + USER.md(你是 AI 硬件产品经理) + MEMORY.md(上次客户关心交付时间)
→ 同一句话,输出质量天差地别。

开机仪式

新对话启动 → 按固定流程加载四文件 → 可在 AGENTS.md 自定义启动检查清单。

核心洞察

上下文 = 缓存(临时)
文件 = 真正的记忆(永久)
“OpenClaw 的每一个行为都可以追溯到磁盘上的一个文件。”

官方文档

"OpenClaw 的每一个行为都可以追溯到磁盘上的一个文件。"

额外两个迟早会碰到的概念

⑦Tools(工具)

瑞士军刀,内置 25+ 个:命令行执行、浏览器自动化(像真人一样打开网页、登录、填表、点击、截图)。

⑧MCP(Model Context Protocol)

Anthropic 推的开放标准,像 USB 接口。
让 AI 即插即用连接 Notion、Google Drive、数据库等,无需单独适配。

2.4 一条消息的旅程

Agentic Loop(代理循环)

AI 自己决定下一步做什么,可能搜天气、查日程、综合后再回复你。这种自主决策的循环就是 Agent 的核心。

2.5 三个核心原理:它为什么这样设计?

原理一:Agentic Loop(代理循环)

类比:自驱型员工的工作方式
不是“你说一步我做一步”,而是“你给目标,我自己拆解、执行、检查、迭代”。
例子:你说“帮我查明天北京天气”
→ AI 可能循环多次:查天气 → 读你日程(明天有户外会议) → 综合建议穿什么、带伞
核心区别:聊天机器人是“问答”,Agent 是“目标驱动,自己想办法达成”。

原理二:双层记忆调度

类比:人的大脑(工作记忆 vs 长期记忆)
工作记忆(上下文窗口):容量小、临时、用完就忘(像同时记7个电话号码)
长期记忆(磁盘文件):永久保存,但需“回忆”过程(像翻笔记本)
OpenClaw 做法:
对话中把重要信息“抄”到 MEMORY.md 文件里。
下周再聊,它从文件里拉回相关记忆,不会失忆。
生动比喻:“就像学生下课铃响前赶紧把笔记抄完。”

原理三:文件驱动架构

类比:公司制度手册(不是口头约定)
核心哲学:OpenClaw 每一个行为都可追溯到磁盘上的一个文件。
三大优势:
可追溯:AI 为什么这么做?打开文件就知道,不用猜
可版本控制:用 Git 记录每次修改,随时回滚
可调试:输出不对?直接改文件,不用重训模型
对比 ChatGPT:行为藏在黑箱里,不知为何突然变风格。
OpenClaw:一切由你写在文件里的内容决定,透明、可控、非玄学。

三、它能做什么?真实案例 + 场景价值

核心价值:帮你省时间,把重复、低价值劳动自动化。
“概念听一百遍不如案例看一遍。”以下四个真实用户常用场景,每个拆解“用了哪些模块”,方便举一反三。

3.1 办公提效

早间简报(社区最热门入门用法)

每天早7点自动:搜集新闻 → 提炼5条摘要 → 发到飞书
用了哪些模块:Heartbeat定时触发 + 搜索Skill + 消息投递Channel
用户反馈:“以前每天刷新闻30分钟,现在30秒看完。”
三合一精髓:定时 + 主动 + 个性化(MEMORY.md记住你关心的领域)

智能提醒(任务完成主动打电话)

示例指令:“整理完报告后打电话通知我” / “公众号排完版了打电话叫我审核”
不是设闹钟到点响,而是AI自己判断任务完成 → 直接拨打你手机
价值:备忘录常漏看,电话你总会接
用了哪些模块:Heartbeat/Cron判断完成 + execute工具打电话

会议纪要自动化

开完会 → 把录音发给AI → 自动转文字 + 提取结论 & action items → 发给相关人
用了哪些模块:Channel接收文件 + 语音转文字Skill + 结构化输出Skill
价值:从1小时手动整理 → 几分钟自动完成

日报/周报半自动化

AI根据当天飞书消息 + 工作记录,自动草拟日报框架 → 你只需2分钟改几个字
用了哪些模块:Heartbeat定时触发 + Memory记录工作上下文
其他扩展:自动整理报销单据、出差行程规划

3.2 自媒体提效

核心价值:把自媒体从“手工苦力”变成“AI 流水线”,一人带队干一个团队的活。

公众号一键排版

3000字长文 → 发给AI → 3分钟出精美排版 → 直接粘贴到公众号后台发布
用了哪些模块:Skill调用排版模板 + MEMORY.md记住你的风格偏好(字体、间距、配图习惯等)
价值:从1小时手动调格式 → 几分钟一键搞定

小红书内容批量生成

一篇长文 → 5分钟自动拆成5条图文笔记 → 自动配标题、标签、小红书风格 → 发到你手机待审核/发布
用了哪些模块:内容拆解Skill + SOUL.md定义你的内容调性(文艺/干货/种草等)

短视频文案流水线

给一个选题 → AI一键生成:完整脚本 + 分镜描述 + 字幕文案 + 口播建议
你只管拍和剪辑
用了哪些模块:多Skill串联(脚本生成→分镜拆分→字幕优化) + MEMORY.md记录哪类选题数据表现好

越用越聪明的机制

不是模型突然变聪明,而是经验被系统化记录到 MEMORY.md:
哪类标题点击率高
哪种排版转发多
读者偏好哪些开头/结尾
AI 通过这些积累,越来越懂你的受众和平台算法。

用户真实反馈

“以前一个人干三个人的活,现在是一个人带着AI干一个团队的活。”

3.3 团队协作提效

4000封邮件两天处理完

出差两周积压4000封邮件 → AI两天内完成:自动分类、退订垃圾邮件、起草回复(供人工审核)
用了哪些模块:Channel接收邮件 + 分类Skill + MEMORY.md记住常用联系人/风格/历史回复习惯
价值:从几周手动处理 → 两天自动化完成

团队站会自动化

每天下班前收集队员blockers → 早上自动汇总飞书+项目管理工具 → 生成站会简报
用了哪些模块:Heartbeat定时触发 + 多Channel数据聚合 + 结构化输出Skill

3.4 “骚操作”

AI自己给自己写Skill

你让它做一件没对应能力的事 → AI发现缺Skill → 自己写.md文件 → 自己读取安装 → 自己完成任务
本质:相当于员工自己去学新技能、学完直接上手干活

AI自己判断该做什么

你只说了一句“帮我想想办法” → AI:
关键:没让你说“去验证”,它自己觉得“光整理不够,得试过才靠谱”
→ 主动找活干、主动验证、主动迭代