老实说,第一次看到 OpenClaw 这个名字的时候,我以为是某个键盘侠的网名。
结果它是一个自托管 AI 网关——听起来很极客对吧?但用起来其实挺接地气的。简单讲就是:你在手机上发一条消息,就能触发服务器上的 AI 编码助手,然后它通过各种聊天平台给你回消息。
支持 WhatsApp、Telegram、Discord、iMessage 等等。某种程度上,它在做的事情是把 AI 助手"绑"到你日常最常用的聊天软件里,而不是强迫你另开一个 App。
先说清楚它的架构
了解一个工具之前,先知道它是怎么跑起来的,这很重要。
OpenClaw 核心是 Gateway——一个长期运行的守护进程。你可以把它理解为大脑,负责: - 连接各个聊天平台(WhatsApp Bot、Telegram Bot、Discord Bot 等) - 与 AI 模型提供商通信(OpenAI、Claude、Gemini、Ollama 等) - 管理对话上下文和工具调用 - 处理消息的路由和分发
Gateway 可以本地运行,也可以部署到服务器。配置文件是 gateway.yml,里面定义了模型、插件、认证规则等。
然后是 CLI 工具——这是你日常操作 OpenClaw 的主界面。初始化项目、配置频道、启动 Gateway、查看状态,全靠它。
openclawinitmy-project openclawgatewaystart openclawstatus 还有一个 Web 控制台(可选开启)——提供 Dashboard、WebChat、TUI 界面,方便不想用命令行的用户。
系统要求一览
如果只是本地开发机子上跑,MacBook Air M1 完全够用。要跑浏览器自动化或者多插件,可能需要更多资源。
功能全景图
这部分是重点——OpenClaw 到底能做什么?
聊天频道接入
这是大多数人安装 OpenClaw 的原因。它把 AI 助手接入了你熟悉的聊天软件:
- Telegram Bot
— 配置一个 Bot Token 就行,最简单的接入方式 - WhatsApp
— 需要一个手机作为节点,或者用 WhatsApp Business API - Discord
— 创建一个 Discord Bot,配置 guild 和 channel - iMessage
— macOS 上通过 AppleScript 桥接,需要一台 Mac 作为节点 还有飞书、企业微信、WebChat 等其他渠道
关键是:同一个 AI 助手,可以同时连接多个平台。你在 Telegram 上开始对话,切换到 Discord 接着聊,上下文是连续的。
内置工具集
OpenClaw 原生带了一套工具,AI 可以直接调用:
- exec
— 在服务器上执行命令 - browser
— 浏览器控制,可以做网页快照、填表、爬取动态内容 - search
— 网页搜索 - fetch
— HTTP 请求,访问 API 或网页内容 - code interpreter
— 执行代码片段 还有文件操作、代码生成等能力
这意味着 AI 不只是跟你聊天——它能真正帮你做事。比如让它帮你查一个技术问题,顺手把浏览器打开演示给你看。
浏览器自动化
这里值得单独说一下。OpenClaw 的浏览器工具支持:
- 本地浏览器控制
— 直接调起本地的 Chrome/Chromium - 远程 CDP
— 连接到远程浏览器的调试端口,这样服务器上跑的 AI 也能控制你电脑上的浏览器 - 快照功能
— 截取当前页面状态,用于上下文或存档
对于需要登录才能操作的页面,CDP 远程控制特别有用——你可以先在本地浏览器登录,然后把调试端口暴露给 AI。
模型提供商
OpenClaw 做了 Provider 抽象层,官方支持 35+ 提供商:
OpenAI 全家桶(GPT-4、GPT-4o、o1/o3) Anthropic(Claude 3.5、3.7 系列) Google Gemini 本地 Ollama(跑开源模型) 通义千问、文心一言、DeepSeek 等国产模型 还有 Groq、Azure、Cohere 等
配置文件里切换 Provider 非常方便,同一段对话可以随时换模型。
插件系统
如果你需要的功能不在内置工具里,可以自己写插件。OpenClaw 支持:
- 官方插件
— 官方维护的增强包 - npm 插件
— 从 npm 安装 JavaScript/TypeScript 插件 - SDK 开发
— 用 Python/JS 写自定义插件
插件能扩展的工具类型包括:新的工具调用、消息处理器、认证中间件、UI 组件等。
Skills 工作流
这是 OpenClaw 独有的概念——你可以把一套复杂的操作流程封装成"Skill",让 AI 在特定场景下自动执行。
比如设置一个"代码审查 Skill":当你在聊天里发 /review pr #123 时,AI 自动拉取 PR、运行静态分析、生成审查报告。
Skills 支持环境变量注入、参数传递、条件判断。你可以理解为一个带上下文的自动化脚本。
自动化与定时任务
- Cron 任务
— 定时触发某个 Skill 或对话 - Webhooks
— 外部服务触发 OpenClaw 执行任务 - Hooks
— 在特定事件(如消息接收、对话结束)发生时执行自定义逻辑
举个例子:设置一个每日早上的"热点推送"任务,AI 自动抓取技术新闻,通过 Telegram 发给你。
认证与访问控制
生产环境使用的话,安全很重要。OpenClaw 提供:
- 配对机制
— 新设备首次连接需要管理员审批 - 频道级安全
— 不同平台可以设置不同的认证规则 - 白名单/黑名单
— 基于用户 ID 或群组过滤
部署方式
根据你的场景,OpenClaw 支持多种部署方式:
本地开发 — 最简单的玩法,克隆项目、按文档初始化、启动 Gateway,5 分钟能跑起来。
SSH 远程 — 服务器上部署,本地通过 CLI 操控。适合需要 24/7 运行但不想暴露本地机器的场景。
Docker — 官方提供镜像,一行命令起容器。适合有 Docker 环境的用户。
Tailscale — OpenClaw 支持通过 Tailscale 组网,实现内网穿透访问,避免把端口暴露到公网。
Fly.io / VPS — 对于有一定运维能力的用户,支持主流的云平台部署。
学习路径建议
说了这么多功能,具体怎么学?我的建议是分阶段:
入门阶段:先跑起来。安装 → 初始化 → 连接一个频道(Telegram 最简单)→ 发一条消息让 AI 回复。跑通这个流程,你就入门了。
渠道阶段:把 WhatsApp、Discord 也接进来,体验多平台统一对话的感觉。这个阶段你会开始理解 OpenClaw 作为"网关"的意义。
配置阶段:深入 Gateway 配置、认证规则、安全设置。这个阶段建议把官方文档的"安全与访问控制"章节仔细看一遍。
工具阶段:玩转内置工具集。试试让 AI 帮你执行命令、搜索网页、控制浏览器。你会发现 AI 编程助手不只是聊天——它真的能替你干活。
高级阶段:Skills 工作流、多 Agent 路由、Cron 自动化、插件开发。这部分适合有明确需求再深入。
部署阶段:等你玩熟了本地开发,再考虑部署到服务器或云平台。远程访问、Tailscale 组网、Docker 部署等进阶话题在这个阶段再研究。
写在最后
OpenClaw 这个项目本质上是把 AI 助手"推送"到你已经使用的聊天软件里,而不是强迫你改变使用习惯。它不是一个聊天机器人,而是一个 AI 网关——连接各种聊天渠道、AI 模型、工具能力的中枢。
接下来的教程会按照上面的学习路径,逐章展开讲每个模块怎么配置、怎么使用、有什么坑。
坦白说,这不是一个"小白友好"的开源项目——它面向的是愿意折腾、有一定技术背景的用户。但一旦你玩转了,它能带来的效率提升是很实在的。
下一章我们会讲 安装指南,覆盖各种安装方式和常见踩坑点。
夜雨聆风