深度体验 OpenClaw:一款真正属于你的自托管 AI 助手

写在前面

过去一个月，我把自己的日常工作流迁移到了一个名为 OpenClaw 的开源项目上。说实话，刚开始只是抱着试试看的心态——毕竟市面上打着"AI 助手"旗号的产品实在太多了。

但一个月用下来，我有些意外。

OpenClaw 并不算完美，某些功能还在完善中，配置门槛也比普通 App 高一些。但它给我带来了一个之前从未有过的体验：这是我自己的 AI 助手，不是租来的，不是借来的，是完完全全运行在我自己设备上、由我掌控的私人助理。

这篇文章，我想系统性地介绍一下 OpenClaw 是什么、能做什么、适合谁用，以及它和最近大火的 Manus 等方案有什么区别。如果你是一个 AI 爱好者，或者正在寻找更可控的 AI 工作流，希望这篇文章能给你一些参考。

一、OpenClaw 是什么？

1.1 一句话定义

OpenClaw 是一个自托管的多渠道 AI 智能体网关（Gateway）。

听起来有点技术？让我拆解一下：

自托管：运行在你自己的设备上（电脑、服务器、树莓派都可以），数据不出本地
多渠道：可以同时连接 WhatsApp、Telegram、Discord、微信（需插件）等聊天工具
AI 智能体：不是一次性问答，而是有记忆、有工具、能执行复杂任务的 AI 助手
网关：它是你所有聊天设备和 AI 模型之间的"中转站"

1.2 核心架构图

┌─────────────────────────────────────────────────────────────────┐│                        你的聊天设备                              ││    WhatsApp  │  Telegram  │  Discord  │  微信  │  iMessage      │└────────┬────────────┬─────────────┬────────────┬────────────────┘         │            │             │            │         ▼            ▼             ▼            ▼┌─────────────────────────────────────────────────────────────────┐│                     OpenClaw Gateway                            ││  ┌─────────────┐  ┌─────────────┐  ┌─────────────────────────┐  ││  │  渠道管理   │  │  会话管理   │  │  工具系统 (浏览器/文件/ │  ││  │  (多账号)   │  │  (记忆/历史)│  │  搜索/代码执行)         │  ││  └─────────────┘  └─────────────┘  └─────────────────────────┘  ││                         │                                       ││                         ▼                                       ││              ┌─────────────────────┐                            ││              │   AI 模型调用        │                            ││              │  (Anthropic/OpenAI/ │                            ││              │   Google/本地模型)   │                            ││              └─────────────────────┘                            │└─────────────────────────────────────────────────────────────────┘         │         ▼┌─────────────────────────────────────────────────────────────────┐│                    你的移动设备 (可选)                           ││         iOS/Android App - 语音/相机/屏幕共享                     │└─────────────────────────────────────────────────────────────────┘

1.3 它能帮你做什么？

举几个我实际使用的场景：

场景	具体用法
日常问答	在 WhatsApp 上随时问问题，AI 会记住之前的对话上下文
信息整理	让它帮忙总结长文章、提取关键信息、做会议纪要
代码辅助	直接让它写脚本、改代码、解释报错信息
自动化任务	定时提醒、定时抓取信息、批量处理文件
多账号管理	工作号和生活号可以连接不同的 AI"人格"

二、为什么需要自托管？

在深入介绍 OpenClaw 之前，我想先聊聊"自托管"这件事。

2.1 你可能没意识到的问题

当你使用大多数 AI 服务时（包括某些知名产品）：

❌ 你的对话数据存储在服务商的服务器上
❌ 服务商可以随时修改服务条款、调整价格、甚至关停服务
❌ 你无法自定义 AI 的行为逻辑和工具权限
❌ 多个 AI 服务之间的数据是割裂的

我不是说这些服务不好——它们确实方便，而且大多数时候很可靠。但问题是：你把太多控制权交出去了。

2.2 自托管的优势

OpenClaw 代表的自托管方案，核心优势在于：

维度	云端服务	自托管 (OpenClaw)
数据控制	服务商存储	本地存储，完全掌控
服务稳定性	依赖服务商	自己掌控，7×24 运行
定制能力	有限	几乎无限（开源）
成本	订阅费	主要是电费和模型 API 费
隐私	取决于服务商政策	自己决定
学习成本	低	中等（需要一些技术基础）

2.3 自托管 ≠ 与世隔绝

这里有个常见误解：自托管是不是意味着不能用强大的云端模型了？

不是的。

OpenClaw 自托管的是"网关"和"会话管理"，AI 模型本身仍然可以调用云端最强的模型（比如 Claude、GPT-4 等）。你只是把"中间层"掌握在自己手里，而不是把一切都交给某个封闭平台。

三、OpenClaw 核心功能详解

3.1 多渠道接入：一个 AI，随处可达

OpenClaw 最直观的优势是：你可以在任何常用的聊天工具里和 AI 对话。

支持的渠道

渠道	内置支持	配置难度	适用场景
WhatsApp	✅	中	日常沟通
Telegram	✅	低	技术用户、机器人生态
Discord	✅	低	社区、团队协作
iMessage	✅	中	苹果生态用户
Signal	✅	中	隐私优先用户
微信	🔌 插件	高	国内用户（需额外配置）
Slack	✅	低	工作场景
Mattermost	🔌 插件	中	自托管团队

我的使用方式

我自己是这样配置的：

WhatsApp：连接日常 AI 助手，快速问答、查信息
Telegram：连接开发者 AI，处理代码相关任务
Web 控制台：在电脑前工作时直接用浏览器界面

这样的好处是：场景分离。不同渠道的 AI 可以有不同的"人格"、不同的工具权限、不同的记忆空间。

3.2 会话管理：AI 真的能"记住"你

大多数 AI 聊天服务，每次对话都是"失忆"的——除非你在使用某个特定的聊天机器人产品。

OpenClaw 的会话管理机制更加灵活：

会话隔离策略

 // 配置文件示例{  session: {    // 推荐：不同发送者的私信隔离    dmScope: "per-channel-peer",    // 每日自动重置（凌晨 4 点）    reset: {      mode: "daily",      atHour: 4,    },    // 空闲超时重置（2 小时无活动）    idleMinutes: 120,  }}

这意味着：

✅ 不同的人和你 AI 发消息，看到的是不同的对话历史
✅ 群聊和私聊的上下文是隔离的
✅ 可以设置每天自动"刷新"会话，避免上下文污染

记忆系统

OpenClaw 有两层记忆：

短期记忆：当前会话的完整对话历史（存储在本地 JSONL 文件）
长期记忆：MEMORY.md 文件，存储需要长期保留的信息

// memory/2026-04-07.md 示例- Nancy 偏好使用中文交流- 工作时间：周一至周五 9:00-18:00- 正在进行的项目：OpenClaw 中文文档整理

AI 会在对话过程中自动把重要信息写入记忆文件，下次对话时可以检索到。

3.3 工具系统：AI 不只是聊天

这是 OpenClaw 和普通聊天机器人最大的区别——它有手有脚，能真正帮你做事。

内置工具清单

工具	功能	安全级别
`read`	读取文件内容	安全
`write`	创建/覆盖文件	⚠️ 需权限
`edit`	精确编辑文件	⚠️ 需权限
`exec`	执行 shell 命令	⚠️⚠️ 高权限
`web_search`	网络搜索	安全
`web_fetch`	抓取网页内容	安全
`browser`	浏览器自动化	⚠️ 需权限
`image`	图片分析	安全
`pdf`	PDF 文档分析	安全
`tts`	文字转语音	安全
`cron`	定时任务管理	⚠️ 需权限
`message`	发送消息	⚠️ 需权限

沙箱保护

对于高风险操作（比如执行命令），OpenClaw 支持 Docker 沙箱：

{  agents: {    defaults: {      sandbox: {        mode: "all",        // 所有任务都沙箱化        scope: "agent",     // 每个智能体独立容器      }    }  }}

这样即使 AI 执行了恶意代码，也不会影响你的主机系统。

实际案例

这是我昨天让 AI 帮我做的事：

我：帮我把 ~/Downloads 里所有的 PDF 文件整理到 ~/Documents/PDFs/ 文件夹AI: [思考中...]    1. 先检查源文件夹内容    2. 创建目标文件夹    3. 移动文件    4. 生成整理报告[执行完成] 共移动 12 个文件，详情如下...

整个过程，AI 先"思考"要做什么，然后逐步执行，最后给我反馈。这不是简单的命令执行，而是有规划、有验证的自动化。

3.4 多智能体路由：一个网关，多个"大脑"

这是 OpenClaw 最强大的功能之一。

什么是多智能体？

想象一下，你可以有多个 AI 助手，每个都有：

独立的工作区（不同的文件、配置、记忆）
独立的人设（不同的 SOUL.md、AGENTS.md）
独立的模型配置（有的用 Claude，有的用 GPT）
独立的工具权限（有的能执行命令，有的只能聊天）

配置示例

{  // 定义两个智能体  agents: {    list: [      {         id: "personal",         workspace: "~/.openclaw/workspace-personal",        model: "anthropic/claude-sonnet-4-6"  // 日常用，快速响应      },      {         id: "coding",         workspace: "~/.openclaw/workspace-coding",        model: "anthropic/claude-opus-4-6"   // 写代码用，更强但更贵      },    ],  },  // 路由规则  bindings: [    // WhatsApp 消息路由到 personal    { agentId: "personal", match: { channel: "whatsapp" } },    // Telegram 消息路由到 coding    { agentId: "coding", match: { channel: "telegram" } },  ],}

我的使用场景

智能体	渠道	模型	用途
personal	WhatsApp	Claude Sonnet	日常问答、查信息、写邮件
coding	Telegram	Claude Opus	写代码、Code Review、调试
family	微信群	GPT-4	和家人互动（限制工具权限）

这样配置后，不同场景自动使用不同"大脑"，既节省成本，又保证安全。

四、技术架构解析

这部分稍微硬核一些，适合想了解底层原理的读者。

4.1 整体架构

┌────────────────────────────────────────────────────────────────┐│                        客户端层                                 ││  ┌──────────┐  ┌──────────┐  ┌──────────┐  ┌──────────┐       ││  │  Web UI  │  │  CLI     │  │  macOS   │  │  Mobile  │       ││  │          │  │          │  │   App    │  │   Node   │       ││  └────┬─────┘  └────┬─────┘  └────┬─────┘  └────┬─────┘       │└───────┼─────────────┼─────────────┼─────────────┼──────────────┘        │             │             │             │        └─────────────┴─────────────┴─────────────┘                      │ WebSocket (18789)                      ▼┌────────────────────────────────────────────────────────────────┐│                      Gateway 网关                               ││  ┌──────────────────────────────────────────────────────────┐  ││  │  连接管理  │  会话路由  │  工具调度  │  模型抽象层        │  ││  └──────────────────────────────────────────────────────────┘  ││  ┌──────────────────────────────────────────────────────────┐  ││  │  配置管理 (openclaw.json)                                │  ││  │  认证管理 (auth-profiles.json)                           │  ││  │  会话存储 (sessions/*.jsonl)                             │  ││  │  记忆系统 (MEMORY.md, memory/*.md)                       │  ││  └──────────────────────────────────────────────────────────┘  │└────────────────────────────────────────────────────────────────┘                      │        ┌─────────────┼─────────────┐        │             │             │        ▼             ▼             ▼   ┌─────────┐  ┌─────────┐  ┌─────────┐   │ AI 模型  │  │ 浏览器  │  │ 本地文件 │   │ APIs    │  │ 自动化  │  │ 系统    │   └─────────┘  └─────────┘  └─────────┘

4.2 核心组件

Gateway（网关）

职责：所有客户端连接的中心节点
通信协议：WebSocket（默认端口 18789）
运行模式：可作为系统服务后台运行（launchd/systemd）
配置热重载：修改配置后自动生效，无需重启

Agent（智能体）

工作区：~/.openclaw/workspace，包含 SOUL.md、USER.md、TOOLS.md 等
状态目录：~/.openclaw/agents/<agentId>/agent/
会话存储：~/.openclaw/agents/<agentId>/sessions/

Node（节点）

移动端：iOS/Android App，提供相机、屏幕、位置等设备能力
桌面端：macOS 菜单栏应用
连接方式：WebSocket 配对，支持局域网和 Tailscale 组网

4.3 消息处理流程

1. 用户发送消息 (WhatsApp/Telegram/etc.)         │         ▼2. Gateway 接收消息，解析渠道格式         │         ▼3. 根据 bindings 规则路由到对应 Agent         │         ▼4. 加载会话历史 + 记忆文件 + 系统提示         │         ▼5. 调用 AI 模型 API，流式返回         │         ▼6. 解析工具调用，执行本地操作         │         ▼7. 将响应发送回原渠道         │         ▼8. 更新会话历史和记忆文件

4.4 安全机制

层级	措施
网络层	可选 Tailscale/SSH 隧道，不暴露公网
认证层	Token 认证 + 设备配对审批
权限层	工具白名单/黑名单，沙箱隔离
会话层	多用户隔离，防止信息泄露
配置层	敏感信息支持 SecretRef（环境变量/文件/exec）

五、OpenClaw vs Manus：两种 AI 助手哲学的对比

最近 Manus 很火，很多人问它和 OpenClaw 有什么区别。我用过两者，这里做个客观对比。

5.1 定位差异

维度	Manus	OpenClaw
产品形态	云端 SaaS 服务	自托管开源项目
目标用户	普通用户，追求开箱即用	技术爱好者，追求可控性
部署方式	无需部署，网页/APP 直接使用	需要自己搭建和配置
数据归属	存储在 Manus 服务器	完全本地存储
定制能力	有限，受平台限制	几乎无限，开源可修改
成本结构	订阅费（可能较贵）	主要是模型 API 费 + 电费

5.2 功能对比

功能	Manus	OpenClaw
多渠道接入	❌ 自有 App	✅ WhatsApp/Telegram/Discord 等
记忆系统	✅ 云端存储	✅ 本地 Markdown 文件
工具执行	✅ 云端沙箱	✅ 本地执行 + Docker 沙箱
多智能体	⚠️ 有限支持	✅ 完整的多智能体路由
定时任务	⚠️ 有限	✅ Cron 系统
浏览器自动化	✅	✅
移动端集成	✅ 自有 App	✅ 节点 App（预览中）
离线能力	❌ 依赖网络	⚠️ 部分功能可离线

5.3 使用体验对比

Manus 的优势

✅ 开箱即用：注册账号就能用，无需配置
✅ 界面精美：UI/UX 经过精心设计
✅ 稳定性高：专业团队维护，SLA 保障
✅ 集成生态：可能提供更多预集成服务

OpenClaw 的优势

✅ 数据自主：所有数据在自己手里
✅ 灵活定制：可以修改任何行为
✅ 成本可控：只为实际使用的模型付费
✅ 无厂商锁定：随时可以迁移或修改
✅ 学习价值：深入理解 AI 助手的工作原理

5.4 我的建议

选择 Manus，如果：

你不想折腾技术细节
你信任云端服务的数据管理
你愿意为便利付费
你需要企业级稳定性

选择 OpenClaw，如果：

你有一定的技术基础（或愿意学习）
你重视数据隐私和控制权
你喜欢定制和折腾
你想降低成本（长期来看）
你想深入理解 AI 助手如何工作