写在前面
过去一个月,我把自己的日常工作流迁移到了一个名为 OpenClaw 的开源项目上。说实话,刚开始只是抱着试试看的心态——毕竟市面上打着"AI 助手"旗号的产品实在太多了。
但一个月用下来,我有些意外。
OpenClaw 并不算完美,某些功能还在完善中,配置门槛也比普通 App 高一些。但它给我带来了一个之前从未有过的体验:这是我自己的 AI 助手,不是租来的,不是借来的,是完完全全运行在我自己设备上、由我掌控的私人助理。
这篇文章,我想系统性地介绍一下 OpenClaw 是什么、能做什么、适合谁用,以及它和最近大火的 Manus 等方案有什么区别。如果你是一个 AI 爱好者,或者正在寻找更可控的 AI 工作流,希望这篇文章能给你一些参考。
一、OpenClaw 是什么?
1.1 一句话定义
OpenClaw 是一个自托管的多渠道 AI 智能体网关(Gateway)。
听起来有点技术?让我拆解一下:
自托管:运行在你自己的设备上(电脑、服务器、树莓派都可以),数据不出本地
多渠道:可以同时连接 WhatsApp、Telegram、Discord、微信(需插件)等聊天工具
AI 智能体:不是一次性问答,而是有记忆、有工具、能执行复杂任务的 AI 助手
网关:它是你所有聊天设备和 AI 模型之间的"中转站"
1.2 核心架构图
┌─────────────────────────────────────────────────────────────────┐│ 你的聊天设备 ││ WhatsApp │ Telegram │ Discord │ 微信 │ iMessage │└────────┬────────────┬─────────────┬────────────┬────────────────┘│ │ │ │▼ ▼ ▼ ▼┌─────────────────────────────────────────────────────────────────┐│ OpenClaw Gateway ││ ┌─────────────┐ ┌─────────────┐ ┌─────────────────────────┐ ││ │ 渠道管理 │ │ 会话管理 │ │ 工具系统 (浏览器/文件/ │ ││ │ (多账号) │ │ (记忆/历史)│ │ 搜索/代码执行) │ ││ └─────────────┘ └─────────────┘ └─────────────────────────┘ ││ │ ││ ▼ ││ ┌─────────────────────┐ ││ │ AI 模型调用 │ ││ │ (Anthropic/OpenAI/ │ ││ │ Google/本地模型) │ ││ └─────────────────────┘ │└─────────────────────────────────────────────────────────────────┘│▼┌─────────────────────────────────────────────────────────────────┐│ 你的移动设备 (可选) ││ iOS/Android App - 语音/相机/屏幕共享 │└─────────────────────────────────────────────────────────────────┘
1.3 它能帮你做什么?
举几个我实际使用的场景:
| 场景 | 具体用法 |
|---|---|
| 日常问答 | 在 WhatsApp 上随时问问题,AI 会记住之前的对话上下文 |
| 信息整理 | 让它帮忙总结长文章、提取关键信息、做会议纪要 |
| 代码辅助 | 直接让它写脚本、改代码、解释报错信息 |
| 自动化任务 | 定时提醒、定时抓取信息、批量处理文件 |
| 多账号管理 | 工作号和生活号可以连接不同的 AI"人格" |
二、为什么需要自托管?
在深入介绍 OpenClaw 之前,我想先聊聊"自托管"这件事。
2.1 你可能没意识到的问题
当你使用大多数 AI 服务时(包括某些知名产品):
❌ 你的对话数据存储在服务商的服务器上
❌ 服务商可以随时修改服务条款、调整价格、甚至关停服务
❌ 你无法自定义 AI 的行为逻辑和工具权限
❌ 多个 AI 服务之间的数据是割裂的
我不是说这些服务不好——它们确实方便,而且大多数时候很可靠。但问题是:你把太多控制权交出去了。
2.2 自托管的优势
OpenClaw 代表的自托管方案,核心优势在于:
| 维度 | 云端服务 | 自托管 (OpenClaw) |
|---|---|---|
| 数据控制 | 服务商存储 | 本地存储,完全掌控 |
| 服务稳定性 | 依赖服务商 | 自己掌控,7×24 运行 |
| 定制能力 | 有限 | 几乎无限(开源) |
| 成本 | 订阅费 | 主要是电费和模型 API 费 |
| 隐私 | 取决于服务商政策 | 自己决定 |
| 学习成本 | 低 | 中等(需要一些技术基础) |
2.3 自托管 ≠ 与世隔绝
这里有个常见误解:自托管是不是意味着不能用强大的云端模型了?
不是的。
OpenClaw 自托管的是"网关"和"会话管理",AI 模型本身仍然可以调用云端最强的模型(比如 Claude、GPT-4 等)。你只是把"中间层"掌握在自己手里,而不是把一切都交给某个封闭平台。
三、OpenClaw 核心功能详解
3.1 多渠道接入:一个 AI,随处可达
OpenClaw 最直观的优势是:你可以在任何常用的聊天工具里和 AI 对话。
支持的渠道
| 渠道 | 内置支持 | 配置难度 | 适用场景 |
|---|---|---|---|
| ✅ | 中 | 日常沟通 | |
| Telegram | ✅ | 低 | 技术用户、机器人生态 |
| Discord | ✅ | 低 | 社区、团队协作 |
| iMessage | ✅ | 中 | 苹果生态用户 |
| Signal | ✅ | 中 | 隐私优先用户 |
| 微信 | 🔌 插件 | 高 | 国内用户(需额外配置) |
| Slack | ✅ | 低 | 工作场景 |
| Mattermost | 🔌 插件 | 中 | 自托管团队 |
我的使用方式
我自己是这样配置的:
WhatsApp:连接日常 AI 助手,快速问答、查信息
Telegram:连接开发者 AI,处理代码相关任务
Web 控制台:在电脑前工作时直接用浏览器界面
这样的好处是:场景分离。不同渠道的 AI 可以有不同的"人格"、不同的工具权限、不同的记忆空间。
3.2 会话管理:AI 真的能"记住"你
大多数 AI 聊天服务,每次对话都是"失忆"的——除非你在使用某个特定的聊天机器人产品。
OpenClaw 的会话管理机制更加灵活:
会话隔离策略
// 配置文件示例{session: {// 推荐:不同发送者的私信隔离dmScope: "per-channel-peer",// 每日自动重置(凌晨 4 点)reset: {mode: "daily",atHour: 4,},// 空闲超时重置(2 小时无活动)idleMinutes: 120,}}
这意味着:
✅ 不同的人和你 AI 发消息,看到的是不同的对话历史
✅ 群聊和私聊的上下文是隔离的
✅ 可以设置每天自动"刷新"会话,避免上下文污染
记忆系统
OpenClaw 有两层记忆:
短期记忆:当前会话的完整对话历史(存储在本地 JSONL 文件)
长期记忆:
MEMORY.md文件,存储需要长期保留的信息
// memory/2026-04-07.md 示例- Nancy 偏好使用中文交流- 工作时间:周一至周五 9:00-18:00- 正在进行的项目:OpenClaw 中文文档整理
AI 会在对话过程中自动把重要信息写入记忆文件,下次对话时可以检索到。
3.3 工具系统:AI 不只是聊天
这是 OpenClaw 和普通聊天机器人最大的区别——它有手有脚,能真正帮你做事。
内置工具清单
| 工具 | 功能 | 安全级别 |
|---|---|---|
read | 读取文件内容 | 安全 |
write | 创建/覆盖文件 | ⚠️ 需权限 |
edit | 精确编辑文件 | ⚠️ 需权限 |
exec | 执行 shell 命令 | ⚠️⚠️ 高权限 |
web_search | 网络搜索 | 安全 |
web_fetch | 抓取网页内容 | 安全 |
browser | 浏览器自动化 | ⚠️ 需权限 |
image | 图片分析 | 安全 |
pdf | PDF 文档分析 | 安全 |
tts | 文字转语音 | 安全 |
cron | 定时任务管理 | ⚠️ 需权限 |
message | 发送消息 | ⚠️ 需权限 |
沙箱保护
对于高风险操作(比如执行命令),OpenClaw 支持 Docker 沙箱:
{agents: {defaults: {sandbox: {mode: "all", // 所有任务都沙箱化scope: "agent", // 每个智能体独立容器}}}}
这样即使 AI 执行了恶意代码,也不会影响你的主机系统。
实际案例
这是我昨天让 AI 帮我做的事:
我:帮我把 ~/Downloads 里所有的 PDF 文件整理到 ~/Documents/PDFs/ 文件夹AI: [思考中...]1. 先检查源文件夹内容2. 创建目标文件夹3. 移动文件4. 生成整理报告[执行完成] 共移动 12 个文件,详情如下...
整个过程,AI 先"思考"要做什么,然后逐步执行,最后给我反馈。这不是简单的命令执行,而是有规划、有验证的自动化。
3.4 多智能体路由:一个网关,多个"大脑"
这是 OpenClaw 最强大的功能之一。
什么是多智能体?
想象一下,你可以有多个 AI 助手,每个都有:
独立的工作区(不同的文件、配置、记忆)
独立的人设(不同的 SOUL.md、AGENTS.md)
独立的模型配置(有的用 Claude,有的用 GPT)
独立的工具权限(有的能执行命令,有的只能聊天)
配置示例
{// 定义两个智能体agents: {list: [{id: "personal",workspace: "~/.openclaw/workspace-personal",model: "anthropic/claude-sonnet-4-6" // 日常用,快速响应},{id: "coding",workspace: "~/.openclaw/workspace-coding",model: "anthropic/claude-opus-4-6" // 写代码用,更强但更贵},],},// 路由规则bindings: [// WhatsApp 消息路由到 personal{ agentId: "personal", match: { channel: "whatsapp" } },// Telegram 消息路由到 coding{ agentId: "coding", match: { channel: "telegram" } },],}
我的使用场景
| 智能体 | 渠道 | 模型 | 用途 |
|---|---|---|---|
| personal | Claude Sonnet | 日常问答、查信息、写邮件 | |
| coding | Telegram | Claude Opus | 写代码、Code Review、调试 |
| family | 微信群 | GPT-4 | 和家人互动(限制工具权限) |
这样配置后,不同场景自动使用不同"大脑",既节省成本,又保证安全。
四、技术架构解析
这部分稍微硬核一些,适合想了解底层原理的读者。
4.1 整体架构
┌────────────────────────────────────────────────────────────────┐│ 客户端层 ││ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ││ │ Web UI │ │ CLI │ │ macOS │ │ Mobile │ ││ │ │ │ │ │ App │ │ Node │ ││ └────┬─────┘ └────┬─────┘ └────┬─────┘ └────┬─────┘ │└───────┼─────────────┼─────────────┼─────────────┼──────────────┘│ │ │ │└─────────────┴─────────────┴─────────────┘│ WebSocket (18789)▼┌────────────────────────────────────────────────────────────────┐│ Gateway 网关 ││ ┌──────────────────────────────────────────────────────────┐ ││ │ 连接管理 │ 会话路由 │ 工具调度 │ 模型抽象层 │ ││ └──────────────────────────────────────────────────────────┘ ││ ┌──────────────────────────────────────────────────────────┐ ││ │ 配置管理 (openclaw.json) │ ││ │ 认证管理 (auth-profiles.json) │ ││ │ 会话存储 (sessions/*.jsonl) │ ││ │ 记忆系统 (MEMORY.md, memory/*.md) │ ││ └──────────────────────────────────────────────────────────┘ │└────────────────────────────────────────────────────────────────┘│┌─────────────┼─────────────┐│ │ │▼ ▼ ▼┌─────────┐ ┌─────────┐ ┌─────────┐│ AI 模型 │ │ 浏览器 │ │ 本地文件 ││ APIs │ │ 自动化 │ │ 系统 │└─────────┘ └─────────┘ └─────────┘
4.2 核心组件
Gateway(网关)
职责:所有客户端连接的中心节点
通信协议:WebSocket(默认端口 18789)
运行模式:可作为系统服务后台运行(launchd/systemd)
配置热重载:修改配置后自动生效,无需重启
Agent(智能体)
工作区:
~/.openclaw/workspace,包含 SOUL.md、USER.md、TOOLS.md 等状态目录:
~/.openclaw/agents/<agentId>/agent/会话存储:
~/.openclaw/agents/<agentId>/sessions/
Node(节点)
移动端:iOS/Android App,提供相机、屏幕、位置等设备能力
桌面端:macOS 菜单栏应用
连接方式:WebSocket 配对,支持局域网和 Tailscale 组网
4.3 消息处理流程
1. 用户发送消息 (WhatsApp/Telegram/etc.)│▼2. Gateway 接收消息,解析渠道格式│▼3. 根据 bindings 规则路由到对应 Agent│▼4. 加载会话历史 + 记忆文件 + 系统提示│▼5. 调用 AI 模型 API,流式返回│▼6. 解析工具调用,执行本地操作│▼7. 将响应发送回原渠道│▼8. 更新会话历史和记忆文件
4.4 安全机制
| 层级 | 措施 |
|---|---|
| 网络层 | 可选 Tailscale/SSH 隧道,不暴露公网 |
| 认证层 | Token 认证 + 设备配对审批 |
| 权限层 | 工具白名单/黑名单,沙箱隔离 |
| 会话层 | 多用户隔离,防止信息泄露 |
| 配置层 | 敏感信息支持 SecretRef(环境变量/文件/exec) |
五、OpenClaw vs Manus:两种 AI 助手哲学的对比
最近 Manus 很火,很多人问它和 OpenClaw 有什么区别。我用过两者,这里做个客观对比。
5.1 定位差异
| 维度 | Manus | OpenClaw |
|---|---|---|
| 产品形态 | 云端 SaaS 服务 | 自托管开源项目 |
| 目标用户 | 普通用户,追求开箱即用 | 技术爱好者,追求可控性 |
| 部署方式 | 无需部署,网页/APP 直接使用 | 需要自己搭建和配置 |
| 数据归属 | 存储在 Manus 服务器 | 完全本地存储 |
| 定制能力 | 有限,受平台限制 | 几乎无限,开源可修改 |
| 成本结构 | 订阅费(可能较贵) | 主要是模型 API 费 + 电费 |
5.2 功能对比
| 功能 | Manus | OpenClaw |
|---|---|---|
| 多渠道接入 | ❌ 自有 App | ✅ WhatsApp/Telegram/Discord 等 |
| 记忆系统 | ✅ 云端存储 | ✅ 本地 Markdown 文件 |
| 工具执行 | ✅ 云端沙箱 | ✅ 本地执行 + Docker 沙箱 |
| 多智能体 | ⚠️ 有限支持 | ✅ 完整的多智能体路由 |
| 定时任务 | ⚠️ 有限 | ✅ Cron 系统 |
| 浏览器自动化 | ✅ | ✅ |
| 移动端集成 | ✅ 自有 App | ✅ 节点 App(预览中) |
| 离线能力 | ❌ 依赖网络 | ⚠️ 部分功能可离线 |
5.3 使用体验对比
Manus 的优势
✅ 开箱即用:注册账号就能用,无需配置
✅ 界面精美:UI/UX 经过精心设计
✅ 稳定性高:专业团队维护,SLA 保障
✅ 集成生态:可能提供更多预集成服务
OpenClaw 的优势
✅ 数据自主:所有数据在自己手里
✅ 灵活定制:可以修改任何行为
✅ 成本可控:只为实际使用的模型付费
✅ 无厂商锁定:随时可以迁移或修改
✅ 学习价值:深入理解 AI 助手的工作原理
5.4 我的建议
选择 Manus,如果:
你不想折腾技术细节
你信任云端服务的数据管理
你愿意为便利付费
你需要企业级稳定性
选择 OpenClaw,如果:
你有一定的技术基础(或愿意学习)
你重视数据隐私和控制权
你喜欢定制和折腾
你想降低成本(长期来看)
你想深入理解 AI 助手如何工作
夜雨聆风