
图 1OpenClaw 的整体运行逻辑:消息 → 网关 → 路由 → Agent → 工具/节点 → 回流
写作目标:我不只想回答“OpenClaw 是什么”,还想把它为什么会出现、如何工作、为何强大、边界在哪、风险何在,尽可能讲透。
一、先给结论:OpenClaw 到底是什么?
如果要我只用一句话概括:OpenClaw 不是一个单纯“会聊天”的 AI 应用,而是一个把聊天入口、智能体运行时、工具系统、外部记忆、设备节点和多智能体路由,整合成统一操作面的自托管 AI 助手网关。
在我看来,很多人第一次看到 OpenClaw,会把它误认为“又一个聊天机器人壳子”,或者“把模型接到 WhatsApp/Telegram 的 Bot 工具”。这两种理解都不算错,但都太浅。它真正的独特之处在于:它把消息渠道、Agent 执行、会话状态、设备接入和安全治理统一收拢到一个长期运行的 Gateway 网关里,从而让 AI 不只是一个网页里的对话框,而是变成一个可被持续调用、可路由、可隔离、可扩展、可连接现实设备的个人操作系统入口。
换句话说,在我看来,OpenClaw 的本体不是“聊天”,而是“让一个具备工具能力和持久上下文的 Agent,能够长期存在于你的消息网络与设备网络中”。这就是它会显得比普通聊天机器人更重、比一般 Bot 平台更像系统软件、也比单次调用的 Agent 框架更接近“助手基础设施”的原因。
二、为什么 OpenClaw 这类产品会出现?
在我看来,第一,用户已经不满足于“打开网页再问一次”的 AI 交互模式。真正高频的个人数字行为,天然发生在 WhatsApp、Telegram、Discord、iMessage、邮件、命令行、手机端和浏览器里,而不是某个单独网页。
在我看来,第二,很多人已经意识到,Agent 的价值不在“回答得像不像人”,而在“能否持续接收事件、记住状态、调用工具并采取动作”。因此,AI 需要从被动对话框,升级成可驻留、可执行、可编排的运行时。
在我看来,第三,企业和高级个人用户越来越在意可控性:数据放哪、权限怎么给、是否能本地运行、是否能做多角色隔离、是否能接自己的工具、是否能接自己的设备。也正因为如此,我会把 OpenClaw 看成把“可控”放在第一类设计目标的位置,而不是把它当成附属选项。
三、不要把它看窄:OpenClaw 的四重身份
视角 | 如果从这个角度理解 | 但它又超出了什么 |
聊天机器人 | 它确实可以在聊天软件里回答问题 | 但它还会调用工具、记忆、节点并长期运行 |
Bot 平台 | 它能把 AI 接到多个消息渠道 | 但它不是简单消息转发,而是完整 Agent 网关 |
Agent 框架 | 它可以加载模型、工具、Skills、工作区 | 但它不是一次性脚本,而是长期在线的系统服务 |
个人 AI 操作系统入口 | 它能统一消息、执行、设备与记忆 | 这更接近它的真实定位 |
在我看来,理解 OpenClaw 最关键的一步,就是不要只盯着“它接了哪些大模型”,而要看到它对“AI 入口层”和“Agent 基础设施层”的重构。
四、OpenClaw 的核心架构:它到底是怎么拼起来的?

图 2OpenClaw 脑图:定位、架构、工作区、节点、多智能体与安全边界
按照官方文档的描述,我的理解是,OpenClaw 采用“单个长期运行的 Gateway 网关作为唯一事实源”的设计:消息平台连接、会话、状态、路由与事件推送,集中由 Gateway 维护;CLI、Web 控制台、macOS 应用、自动化程序以及节点设备,则通过 WebSocket 接入同一个控制面。
4.1 Gateway 网关:整个系统的中心枢纽
在我看来,Gateway 不是一个可有可无的代理层,而是 OpenClaw 的中心神经系统。它长期运行,统一拥有消息平台连接,管理会话和路由,并暴露 WebSocket API。
我为什么会特别强调它的“唯一事实源”?因为只要一个系统想要同时支撑多个聊天入口、多台设备、多个智能体、多个控制界面,就必须有一个地方定义“当前谁在线、这条消息属于谁、该路由给哪个 Agent、哪个请求已执行过、哪些事件要推送给谁”。
在我看来,这也是 OpenClaw 与“每接一个渠道就写一个独立 Bot”的根本差异:它不是很多零散连接器的堆砌,而是一个统一调度层。
4.2 WebSocket 控制面:不是页面附属,而是正式协议层
官方架构文档给出的握手方式非常明确:第一帧必须是 connect;握手后,客户端通过 req/res 模式发请求,通过 event 接收服务端事件。
在我看来,这意味着 OpenClaw 把控制面做成了正式协议,而不是“某个页面临时调某几个接口”。它天然适合接 Web UI、CLI、自动化进程乃至其它宿主应用。
从工程角度看,我会认为,这种设计的意义是:OpenClaw 的“前端”并不重要,真正重要的是协议与网关;界面可以换,控制面不必换。
4.3 聊天渠道:让 AI 进入真实沟通场景
OpenClaw 可把 Agent 接入 WhatsApp、Telegram、Discord、iMessage、WebChat 等消息表面。官方文档特别提到:多个渠道可以同时运行,系统会按聊天进行路由。
从产品体验上看,我认为,这一步极其关键。因为一旦 AI 能在你本来就高频使用的通信入口里“出现”,它就不再是一个需要被主动打开的工具,而更像一个持续在线的数字助手。
但也正因如此,在我看来,权限与安全问题会立即上升:聊天渠道越贴近日常主通信链路,出错成本就越高。所以 OpenClaw 在渠道、配对、允许列表与群聊触发规则上留了大量显式配置位。
4.4 Agent 执行面:模型、工作区、Skills 与记忆共同组成“大脑”
OpenClaw 中真正的“智能体”并不是只有一个模型名字。它至少包含四层:模型提供者与认证、工作区文件、记忆文件、Skills/工具使用说明。
这意味着在同一个 OpenClaw 实例里,不同 Agent 可以拥有不同人格、不同规则、不同工具权限、不同记忆与不同会话历史。
这也是为什么在我看来,OpenClaw 的多智能体能力不是简单切换 Prompt,而是更接近“多个相互隔离的数字人格/数字员工在同一网关中并行运行”。
五、工作区:OpenClaw 的“记忆之家”
官方文档对 workspace 的定义非常重要:工作区是智能体的家,是文件工具和工作区上下文使用的唯一工作目录;但同时,文档也明确提醒——工作区只是默认 cwd,并不是天然强沙箱。也就是说,我的判断是,它非常像“Agent 的记忆与习惯目录”,却不等于绝对安全边界。
在我看来,这一定义几乎解释了 OpenClaw 的一半灵魂。因为在 OpenClaw 里,一个智能体不是凭空悬浮的抽象模型,而是住在某个目录里,那里有它的行为规范、口吻、用户信息、工具说明、记忆文件,甚至还有与特定 UI/Canvas 相关的资源。
5.1 工作区里有哪些关键文件?
文件 | 作用 | 为什么重要 |
AGENTS.md | 智能体操作指南与行为规则 | 决定它做事方式、优先级、边界 |
SOUL.md | 人格、语气、风格与边界 | 决定它“像谁”而不是仅“会什么” |
USER.md | 用户是谁、怎么称呼、关系设定 | 决定人机长期关系的一致性 |
IDENTITY.md | 智能体自我身份信息 | 让助手具备持续的自我呈现 |
TOOLS.md | 本地工具与惯例说明 | 帮助模型理解环境,但不直接授予权限 |
MEMORY.md / memory/*.md | 长期笔记与记忆库 | 支撑语义检索与长期上下文 |
skills/ | 工作区级 Skills | 让该 Agent 学会特定工具与流程 |
把这些文件放在一起,我会发现 OpenClaw 的设计哲学非常鲜明:把过去很多系统里隐藏在数据库、Prompt 模板、前端开关和不可见状态中的东西,尽可能外显为用户可见、可版本管理、可迁移的文件结构。
5.2 记忆系统:不是“永远记住一切”,而是可被组织的外部记忆
官方记忆文档指出,OpenClaw 可以对 MEMORY.md 与 memory/*.md 构建小型向量索引,以支持语义检索,并可监视这些文件的变化。默认情况下,系统优先尝试远程嵌入;若配置了本地模型,也可走本地模式。
这也让我更确定,OpenClaw 的“记忆”并非神秘黑盒,而是以文件为核心、以索引为加速层的半透明系统。用户既能读、能改、能备份,也能把部分知识显式写入长期记忆。
在我看来,这种设计的优势是可控、可迁移、可审计;代价是我也必须像经营一个知识库那样经营它,而不是指望它自动神奇成长。
六、Skills:OpenClaw 为什么会“像懂流程一样做事”?
OpenClaw 的 Skills 兼容 AgentSkills 生态。按照官方说明,每个 Skill 本质上是一个带 YAML frontmatter 与说明文档的目录,系统会从内置目录、~/.openclaw/skills 以及工作区 skills/ 中加载,并按优先级覆盖。
这意味着 Skill 不是“插件商店里点一下就装”的单一执行包,而更像是一种把“某类工具该怎么用、什么时候用、有哪些约束、需要哪些环境”结构化写给 Agent 的可复用知识组件。
从能力表现上看,我更倾向于认为,很多人会误以为“Agent 很聪明,所以它会做”;而 OpenClaw 的 Skills 体系更像是在告诉你:很多所谓 Agent 的“聪明”,实际上来自良好的工具教学、清晰的环境约束与明确的任务手册。
6.1 Skills 的真正价值
·在我看来,Skills 最重要的价值之一,就是把隐性的操作经验变成显性的可复用流程资产。
·这样一来,我不需要让同一类工作每次都重新 prompt,而是可以把它固化成工具手册。
·在我的使用想象里,既可以给单个 Agent 配专属 Skill,也可以让多个 Agent 共享 Skill。
·这还意味着我可以把“模型能力”和“工作流能力”解耦:模型换了,流程资产仍然可以复用。
七、多智能体:OpenClaw 为什么不像一个 bot,而像一组数字分身?
我读完官方多智能体文档后的直接感受是:一个 Agent 是一个完全独立作用域的大脑,拥有自己的工作区、自己的状态目录、自己的会话存储,以及自己的认证配置文件。也就是说,我的判断是,多智能体不是“一个主脑切几种模式”,而是“多个相互隔离的脑”同时存在。
在我的理解里,系统可以按 channel、accountId、peer、group、team、guild 等维度进行绑定,把不同消息路由到不同 Agent。于是,你就可以在同一套 OpenClaw 里,同时运行“家庭助手”“工作助手”“深度研究助手”“低权限群聊助手”等不同人格。
7.1 多智能体能带来什么?
场景 | 做法 | 价值 |
个人/工作隔离 | 把不同渠道或账号绑定到不同 Agent | 避免会话、认证与人格混杂 |
群聊低权限助手 | 专门给群组绑定一个只读或受限工具集 Agent | 减少误操作风险 |
家庭/朋友助手 | 对特定号码或群路由到不同人格 | 更自然地适配不同关系语境 |
深度工作与日常聊天分离 | Telegram 进“深度工作 Agent”,WhatsApp 进“日常 Agent” | 把模型成本、行为风格与工作流分层 |
从组织学视角看,我认为,这一设计非常重要。它意味着 OpenClaw 不只是在模拟“一个万能助手”,而是在提供一个“多角色 AI 运营平台”的雏形。
八、节点(Nodes):OpenClaw 为什么能长出“身体”?
在我看来,节点是 OpenClaw 很容易被低估、但极具想象力的一部分。官方文档把节点定义为配套设备:macOS、iOS、Android 或无头设备可以以 role: node 连接到 Gateway,并通过 node.invoke 暴露 canvas.*、camera.*、system.* 等命令。
这意味着在我眼里,OpenClaw 不再只是“在消息里回字”,而是有机会通过外接节点去操作屏幕、访问相机、执行系统命令、提供可视化 Canvas,甚至把执行落在另一台机器上。
当我看到一个 Agent 开始拥有“跨设备行动半径”时,我就会明白为什么 OpenClaw 的设计越来越像操作系统中间层,而不是单一聊天产品。
九、一次完整交互是如何发生的?
·1. 我会把完整交互的起点放在:用户从 WhatsApp、Telegram、Discord、WebChat、CLI 或 Web UI 发送消息。
·2. 接着,消息先到 Gateway 网关,由它识别来源渠道、账号、对话对象与会话状态。
·3. 然后,路由系统根据 bindings 决定把消息交给哪个 Agent。
·4. 在我的理解里,该 Agent 会加载自己的模型配置、工作区文件、记忆索引与可见 Skills。
·5. 随后,模型会结合上下文判断:直接回答,还是调用某个工具/节点/外部动作。
·6. 如果涉及工具,系统会依据权限边界与运行环境执行;若涉及节点,则通过 node.invoke 在外部设备上落地。
·7. 最后,执行结果会回流到 Agent,再由 Gateway 推回相应渠道,形成一次完整闭环。
在我看来,这个闭环看似自然,其实背后隐含着一整套很严肃的系统问题:身份认证、连接管理、幂等重试、会话归属、工具授权、远程执行、状态同步、事件推送。OpenClaw 之所以“看起来像一个会回复的机器人”,只是因为它把这些复杂性藏在了架构里。
十、安装与部署:为什么 OpenClaw 更像系统服务而不是 App?
GitHub README 与安装文档都把推荐路径写得很明确:Node 版本要求较新(官方文档给出 Node ≥22),推荐通过 openclaw onboard 向导安装,并把 Gateway 配置成 launchd / systemd 的用户级常驻服务。
这也意味着,在我看来,OpenClaw 的默认使用方式不是“打开一下,聊完就关”,而是“像守护进程一样一直在线”。只有这样,它才能持续监听渠道、维护会话、接受 Web UI/CLI 连接并处理自动化事件。
如果让我来判断,谁要是把它当作一次性命令行玩具,会低估它;如果你把它当成长期在线的 Agent 网关,就会理解为什么它的配置、日志、认证、服务化与更新机制都被单独设计。
十一、OpenClaw 真正强大的地方,不在“它支持多少模型”
我看到很多介绍 Agent 项目时,喜欢把重点放在“支持 OpenAI、Anthropic、Gemini、Ollama、OpenRouter……”,OpenClaw 确实也支持多种模型提供方式。但如果只从模型列表理解它,你会完全错过重点。
在我看来,OpenClaw 真正强大的地方,在于它把以下四种能力叠在了一起:
·第一,在我看来,消息入口被统一之后,AI 才真正进入真实通信网络,而不是只停留在一个网页里。
·第二,我会特别看重状态与记忆的持久化:工作区、记忆、会话都可以长期存在。
·第三,在我眼里,工具与流程是可以被教学的,Skills 让复杂操作具备可复用性。
·第四,我认为执行半径的可扩展更关键:节点与远程主机让它不止会回答,还能真正把动作落下去。
在我看来,这四者叠加之后,OpenClaw 的定位就从“对话工具”变成了“个人 AI 基础设施”。
十二、但它为什么也更危险?
在我看来,越强的系统,越不应该只谈炫技,而必须谈边界。OpenClaw 官方安全文档本身就很长,说明项目从设计上已经承认:一旦 AI 接入真实聊天渠道、真实文件系统、真实设备节点和真实执行环境,它的风险等级就远高于普通网页聊天机器人。
12.1 官方文档已经明确提醒的几个关键点
·我特别想强调这一点:工作区不是天然硬沙箱。相对路径围绕工作区解析,但绝对路径仍可能访问主机其他位置,除非显式启用沙箱隔离。
·在我看来,所有 WebSocket 客户端和节点都涉及配对与设备身份;新设备需要批准,这一步绝不能被省略。
·如果由我来部署,我会优先选择 Tailscale / VPN 或 SSH 隧道做远程访问,而不是把控制端口直接裸露到公网。
·如果我的前面还有反向代理或 TLS 终止层,我会特别注意 trustedProxies、认证模式与头部信任边界。
·我会把节点配对视为接近管理员能力的操作;一旦误配高权限节点,就等于给 Agent 增加了真实世界的操作杠杆。
12.2 从治理视角看,OpenClaw 最大的风险并不是“模型胡说八道”
在我看来,真正高阶的风险,是“一个看似方便的个人助手,被逐步授予了聊天入口、文件访问、执行权限和远程设备能力,而系统所有者却并未建立对应的权限模型、审计机制和最小授权习惯”。
也就是说,我的判断是,OpenClaw 的危险不主要来自“它不聪明”,恰恰来自“它足够有用,于是人会忍不住持续给它更多权力”。
十三、什么人最适合用 OpenClaw?
人群 | 适配度 | 原因 |
高级个人用户 / 极客 | 很高 | 能接受守护进程、自托管、配置文件、权限治理与长期维护 |
独立开发者 / 小团队 | 很高 | 能把消息入口、工具流程、研究助手和自动化打通 |
重度跨平台消息用户 | 高 | 希望 AI 直接存在于日常沟通网络中 |
只想要“打开网页问一问”的普通用户 | 一般 | OpenClaw 的系统复杂度可能明显过剩 |
缺乏运维/安全意识但又想给高权限的用户 | 低 | 收益可能被风险抵消 |
十四、什么场景不该贸然上 OpenClaw?
·如果我自己并不准备维护长期运行服务,也不想碰日志、配置、权限与更新,那我就不该贸然上 OpenClaw。
·如果我只需要一个简单聊天入口,并不需要多渠道、工具、记忆、节点和多智能体,那么 OpenClaw 对我来说大概率过重。
·如果我手里的数据与权限极为敏感,但又还没有成熟的设备配对、审计与沙箱策略,我不会建议自己直接上生产。
·如果我真正想要的是“零维护、全托管、开箱即用”,而不是“强可控、强可定制”,那我会优先选择别的方案。
在我看来,很多人会把“功能更多”误当成“更适合自己”。OpenClaw 的正确打开方式不是盲目追新,而是先判断:你是否真的需要一个 AI 网关,而不只是一个 AI 聊天框。
十五、如何正确评价 OpenClaw:它不是“大模型应用”,而是“Agent 基础设施”
如果我把 OpenClaw 仅仅看成一个 AI 应用,你会问:界面好不好看?回复快不快?支持多少模型?
如果我把 OpenClaw 看成 Agent 基础设施,你会问:消息面是否统一?控制面是否清晰?工作区是否可迁移?多智能体是否隔离?权限边界是否严谨?节点接入是否可信?自动化是否可持续?
在我看来,后者才是评价 OpenClaw 更准确的方式。因为它解决的不是“如何再做一个聊天窗口”,而是“如何把一个持续存在、可被治理、可被扩展的 AI 助手真正落入现实操作链路”。
最后的判断:OpenClaw 值不值得认真研究?
非常值得。因为它代表了一条很清晰的产品路线:AI 不只是网页里的模型,而会逐渐演化成一个长期在线、带执行能力、带外部记忆、带设备触角、能被多入口调用的“个人 Agent 基础设施”。
但也必须同样认真地说:OpenClaw 不是那种可以只看演示视频、靠一时兴奋就上线所有权限的项目。它越强,就越需要工程化使用;越像系统,就越需要系统级治理。
所以,对它最准确的评价不是“酷不酷”,而是:它把 AI 助手从“一个应用”推进成了“一个可运行、可治理、可扩展的基础设施层”。而这,恰恰是未来几年最值得持续追踪的方向之一。
OpenClaw 真正让人兴奋的,不是它又接入了一个模型,或者又支持了一个渠道;而是它正在把 AI 从“你偶尔打开的工具”,变成“长期存在于你消息网络、知识网络和设备网络中的数字操作层”。 这既是它最迷人的地方,也是它最需要被严肃对待的地方。
以下资料用于本文事实核对与架构梳理。
• OpenClaw 官网首页https://openclaw.ai/
• OpenClaw 官方文档(中文)https://docs.openclaw.ai/zh-CN
• OpenClaw GitHub READMEhttps://github.com/openclaw/openclaw/blob/main/README.md
• Gateway 网关架构https://docs.openclaw.ai/zh-CN/concepts/architecture
• 安装文档https://docs.openclaw.ai/zh-CN/install
• 聊天渠道https://docs.openclaw.ai/zh-CN/channels
• 智能体工作区https://docs.openclaw.ai/zh-CN/concepts/agent-workspace
• 记忆https://docs.openclaw.ai/zh-CN/concepts/memory
• 多智能体路由https://docs.openclaw.ai/zh-CN/concepts/multi-agent
• 节点https://docs.openclaw.ai/zh-CN/nodes
• Skillshttps://docs.openclaw.ai/zh-CN/tools/skills
• 安全性https://docs.openclaw.ai/zh-CN/gateway/security
• 控制 UIhttps://docs.openclaw.ai/zh-CN/web/control-ui
夜雨聆风