大白话聊 OpenClaw 4:认识 OpenClaw

认识 OpenClaw——你的 AI 管家长什么样？

大白话聊 OpenClaw 系列（四）

想象你有一个超级管家。

你可以在微信上跟他说话，也可以发 Telegram 消息给他，还可以在 Discord 上 @ 他，甚至发邮件也行。不管你用什么方式联系他，他都是同一个管家，记得你之前说过的所有事情，而且他住在你自己家里——不是什么中介公司派来的。

如果这个管家真的存在，你会怎么理解他的"工作方式"？

他得有一个"前台"，接收你从不同渠道发来的消息
他得有一个"大脑"，理解你说的是什么意思
他得有"双手"，能帮你真正做事
他还得有一个"记事本"，记住你们之前聊过什么

OpenClaw，就是这样一个数字世界里的超级管家。 今天，我们正式走进它的"家"，看看里面到底是怎么布局的。

先搞清楚一个前提：什么叫"跑在你自己的设备上"？

在认识 OpenClaw 之前，我们先搞清楚一个很多人容易混淆的概念。

你平时用 ChatGPT、豆包、Kimi 这些 AI 产品，打开网页或 App 就能用。它们的 AI 跑在哪里？跑在别人的服务器上。你的每一句话都发到了互联网的另一端，由别人的电脑来处理，结果再传回来。

OpenClaw 不一样。它跑在你自己的设备上——你的电脑、你的笔记本、你的服务器。

这就像做饭：

用 ChatGPT = 点外卖——你说想吃什么，餐厅在远方帮你做，快递送过来。方便，但你不知道后厨加了什么，也控制不了。
用 OpenClaw = 在自己家厨房做——食材你买的，流程你看着，做出来的饭在你的餐桌上。稍微麻烦一点，但一切尽在你的掌控。

当然，OpenClaw 在"做菜"的时候，还是需要用到大模型的能力（就像做菜需要用天然气）。所以它会通过 API 调用远程的模型——但重要的是：管家本身住在你家，只是做菜时打个电话问了一下大厨配方。 你的对话历史、你的配置、你的数据，全都留在你自己这里。

OpenClaw 的"身体结构"：五大核心部件

好，现在让我们走进这个管家的"身体"，看看它由哪些部分组成。

我画一张简化的示意图给你：

你（用户）  │  ├── Telegram  ├── Discord  ├── WhatsApp  ├── Slack  ├── Signal  ├── iMessage  └── 更多……  │  ▼┌─────────────────────────────────┐│    ① 消息渠道（Channel）          │  ← 不同平台的"翻译官"│         翻译成统一格式              │└───────────┬─────────────────────┘            ▼┌─────────────────────────────────┐│    ② 网关（Gateway）              │  ← 管家的"前台"│      接收、验证、调度               │└───────────┬─────────────────────┘            ▼┌─────────────────────────────────┐│    ③ 路由（Routing）              │  ← "电话总机"│   决定交给哪个 Agent 处理          │└───────────┬─────────────────────┘            ▼┌─────────────────────────────────┐│    ④ Agent（智能体）              │  ← 管家的"大脑+双手"│   思考（调用模型）+ 行动（调用工具）  │└───────────┬─────────────────────┘            ▼┌─────────────────────────────────┐│    ⑤ 插件系统（Plugin）           │  ← 管家的"技能库"│   随时可以学习新能力                │└─────────────────────────────────┘

接下来，我们一个一个认识。

① 消息渠道（Channel）——20 多种语言的"翻译官"

你需要先知道的概念：消息渠道就是你和 AI 之间的通信方式——Telegram 是一个渠道，Discord 也是一个渠道，WhatsApp 还是一个渠道。

OpenClaw 支持 20 多个消息渠道。这个数字很夸张，但背后的逻辑其实很简单：

每个聊天平台，说的都是自己的"方言"。

Telegram 的消息格式和 Discord 的完全不一样。WhatsApp 发图片的方式和 Slack 发图片的方式也不一样。如果 OpenClaw 的核心要针对每个平台写一套逻辑，那会累死。

所以 OpenClaw 用了一个聪明的办法——给每个平台配一个"翻译官"（Channel Plugin）。

翻译官的工作很简单：

收到消息时：把这个平台特有的消息格式，翻译成 OpenClaw 内部的"普通话"
发送回复时：把 OpenClaw 内部的"普通话"，翻译成这个平台能懂的格式

这样，OpenClaw 的核心只需要处理"普通话"就行了，不用关心消息是从 Telegram 来的还是从 Discord 来的。

一句话理解：消息渠道就是 AI 管家的"耳朵"和"嘴巴"——不管你用什么语言跟他说话，他都能听懂，也能用你的语言回你。

② 网关（Gateway）——管家的"前台"

你需要先知道的概念：网关是一个在后台运行的服务，负责管理所有进出的通信。你可以把它理解为管家坐镇的"前台"。

所有消息，不管从哪个渠道进来，第一站都是网关。

网关做什么？

接收：接收来自各个渠道的消息
验证：检查发送者的身份——你是谁？你有没有权限跟这个 AI 说话？
调度：把验证通过的消息分发到下一步处理
管理：监控各个渠道的健康状态、管理配置更新

这里有一个有意思的安全设计：配对（Pairing）机制。

当一个陌生人第一次给你的 AI 发消息时，AI 不会直接回复他。它会给这个人一个"配对码"——就像小区门禁一样，你得先按门铃，物业确认你是业主的朋友，才会给你开门。

只有你（AI 的主人）通过了这个配对请求，这个人以后才能和你的 AI 对话。

一句话理解：网关是管家的前台——接电话、查身份、安排工作，确保不该进来的人进不来。

③ 路由（Routing）——电话总机

你需要先知道的概念：路由就是"消息分发"——决定一条消息应该交给谁来处理。

如果你只有一个 Agent，路由很简单——所有消息都给它就行。

但 OpenClaw 支持多个 Agent。

为什么你需要多个 Agent？想想这个场景：

你有一个"工作助手"，它知道你的工作上下文，接入了你的项目管理工具
你有一个"生活助手"，它管你的日程、提醒、购物清单
你有一个"学习助手"，它帮你做学习笔记、回答学术问题

当一条消息进来，路由系统就要决定：这条消息该交给谁？

路由的匹配逻辑其实很像快递分拣：

首先看最精确的地址：这个人的消息是不是已经绑定了特定的 Agent？
再看群组/频道级别：这个 Discord 服务器是不是绑定了某个 Agent？
最后看兜底规则：如果都没有匹配到，交给默认的 Agent。

一句话理解：路由是管家团队的"调度员"——哪件事该谁干，它说了算。

④ Agent（智能体）——大脑和双手

你需要先知道的概念：Agent 我们在第二篇详细讲过了——它是一个有感知、能思考、会行动的 AI 助手。

在 OpenClaw 里，Agent 是真正"干活"的核心。

当一条消息被路由到某个 Agent 后，Agent 开始工作：

组装上下文：把这条消息、之前的对话历史、相关的背景信息打包在一起（这个过程由"上下文引擎"完成——你可以理解为助手在翻看之前的会议纪要）
调用模型：把上下文发给大语言模型（比如 GPT-4o），让它"思考"怎么回答
执行工具（如果需要）：如果模型判断需要做些什么（查天气、执行命令、发消息……），Agent 会调用相应的工具
生成回复：把思考结果和工具执行结果组织成回复
发回消息：通过网关和渠道，把回复发回给你

Agent 还有一个重要的配套：会话（Session）。会话就是 Agent 的"对话记录本"——每次对话结束后，内容会被保存下来，下次你再来聊，Agent 还能接着上次的话题继续。

一句话理解：Agent 是管家本人——听你说话、用脑子想、用手做事、记住你们的对话。

⑤ 插件系统（Plugin）——无限扩展的技能库

你需要先知道的概念：插件就像手机里的 App——出厂时只有基础功能，装了 App 就有了新能力。

OpenClaw 的设计哲学是核心精简、插件优先——核心只保留最基本的能力，其他所有东西都可以通过插件来添加。

插件能添加什么？几乎任何东西：

新的聊天渠道：想连接一个新的聊天平台？装个插件就行
新的模型：想用一个新的 AI 大脑？装个插件就行
新的工具：想让 AI 能操作某个特定的服务？装个插件就行
新的技能：想让 AI 会查天气、管 GitHub、控制智能家居？装个插件就行

OpenClaw 目前内置了 80 多个扩展和 50 多个技能，覆盖了大量常见需求。而且因为它是开源的，任何人都可以开发新的插件。

关于插件系统的更多细节，我们后面会有一篇专门来讲。

一句话理解：插件系统是管家的"进修学院"——今天不会的技能，明天学了就会了。

把五个部件连起来看

现在让我们把这五个部件串起来，用一句话描述 OpenClaw 的工作流程：

你通过任意一个聊天平台（渠道）发了一条消息 → 网关接收并验证 → 路由决定交给哪个 Agent → Agent 用大模型思考、用工具行动 → 回复通过网关发回给你。整个过程中，插件系统让每个环节都可以扩展。

就像一个运转良好的管家团队：

渠道是管家的"多条电话线"
网关是"前台"
路由是"调度员"
Agent是"管家本人"
插件是管家的"技能证书架"

OpenClaw 和你已经知道的产品有什么不同？

最后，让我们把 OpenClaw 和你可能已经在用的产品做个对比，帮你更直观地理解它的定位：

	ChatGPT / 豆包 / Kimi	OpenClaw
AI 在哪里运行	别人的服务器	你自己的设备
聊天入口	只能在它的 App/网页上	你已经在用的任何聊天工具
用的什么模型	固定一家（或少数几家）	你自由选择，随时切换
数据在哪里	在别人的服务器上	在你自己的设备上
能不能扩展	基本不能	插件系统，无限扩展
能不能改	不能，闭源	开源，随便改
价格	月费（通常 $20/月）	只付模型 API 用量费（按量付）

两种方式没有绝对的优劣——点外卖方便，自己做饭自由。关键看你在意什么。

本篇小结

今天我们正式走进了 OpenClaw 的大门，认识了它的五大核心部件：

消息渠道（Channel）：连接你所有的聊天平台——管家的"多条电话线"
网关（Gateway）：接收、验证、调度——管家的"前台"
路由（Routing）：决定消息交给谁——管家的"调度员"
Agent（智能体）：思考和行动的核心——管家本人
插件系统（Plugin）：无限扩展的技能库——管家的"进修学院"

一句话总结：OpenClaw 是一个跑在你自己设备上的 AI Agent 平台。它不限制你用什么聊天工具、不限制你用什么模型、不拿走你的数据，还能通过插件无限扩展。

接下来的几篇，我们会深入到每个部件里面去——下一篇，我们先来仔细看看路由系统：当消息涌进来的时候，OpenClaw 到底是怎么决定"这条消息该交给谁"的？

下一篇见 👋