OpenClaw 深度全景分析

OpenClaw 是 2026 年增长最快的开源项目——一个自托管、模型无关的自主 AI Agent 平台，能通过 WhatsApp、Telegram、Slack 等 25+ 通讯渠道实际执行任务。 由奥地利程序员 Peter Steinberger 于 2025 年 11 月创建，短短数月内获得 33 万+ GitHub Star，超越 React 和 Linux 成为 GitHub 历史上增长最快的项目。NVIDIA CEO 黄仁勋将其称为 "个人 AI 的操作系统"，而严重的安全漏洞也引发了全球关注。以下是对 OpenClaw 八大维度的完整技术解析。

一、OpenClaw 是什么：从"龙虾机器人"到 AI Agent 操作系统

OpenClaw 的核心定位是 "真正做事的 AI"（The AI that actually does things）——不只是聊天，而是能清理邮箱、发送邮件、管理日历、办理航班值机、控制智能家居、执行代码、自动化工作流。

起源与命名演变

OpenClaw 由 Peter Steinberger 创建，他是 PSPDFKit（后以约 8 亿美元出售）的创始人，被维基百科称为"奥地利 Vibe Coder"。项目经历了三次命名：

2025 年 11 月：以 "Clawdbot" 之名首次发布（灵感来自 Anthropic 的 Claude，取谐音"Clawd"）
2026 年 1 月 27 日：因 Anthropic 商标投诉更名为 "Moltbot"（保留龙虾/蜕皮主题）
2026 年 1 月 30 日：最终定名 "OpenClaw"——"Open"代表开源与社区驱动，"Claw"承继龙虾血统

项目在 2026 年 1 月末病毒式传播，72 小时内获得 6 万 Star，到 2026 年 3 月已突破 33 万 Star、6.3 万+ Fork、1,075+ 贡献者。

核心理念与技术特征

特征	说明
自托管	运行在用户自己的设备上——笔记本、Mac Mini、树莓派、VPS、云服务器
模型无关	支持 Claude、GPT、Gemini、DeepSeek、Grok、Ollama 本地模型、智谱 GLM、Kimi 等
多渠道接入	通过 WhatsApp、Telegram、Discord、Slack、Signal、iMessage、微信、飞书等 25+ 平台操控
Skills 可扩展	模块化技能系统，ClawHub 上已有 13,729+ 社区技能
MCP 原生支持	兼容 3,200+ MCP 服务器，连接数据库、API、SaaS 平台
隐私优先	所有数据本地存储，除非用户明确配置否则不外传
持久记忆	跨对话记忆上下文，以本地 Markdown 文件存储

开源状态：MIT 许可证，TypeScript + Swift 编写，Node.js 24 运行时。安装命令：npm install -g openclaw@latest。

创始人动态

2026 年 2 月 14 日，Steinberger 宣布加入 OpenAI，项目将移交至独立的开源基金会。此前 Meta（扎克伯格通过 WhatsApp 联系）和 OpenAI（Sam Altman）均提出了数十亿美元级别的收购要约，但被他拒绝。Sam Altman 称 Steinberger 为"一位对超智能 Agent 未来有着许多惊人想法的天才"。

二、应用场景：从个人助手到"一人公司"基础设施

OpenClaw 的应用场景覆盖个人生产力、企业自动化、内容创作、开发运维、金融交易等多个领域，以下是核心用例及实际案例。

个人生产力自动化

OpenClaw 最基础的价值在于替代重复性数字劳动：邮箱管理（收件箱整理、每日摘要、自动回复草稿）、日历调度、晨间简报（整合多数据源）、健康数据追踪（WHOOP 集成）、智能家居控制（空气质量、照明）、快递跟踪、个人知识管理（Obsidian 集成）等。

企业与商业自动化

在商业领域，OpenClaw 展现了强大的自动化能力。客户服务方面，一家餐厅使用 OpenClaw 将响应时间从 4 小时以上缩短至 2 分钟以内，自动化处理 60-80% 的常规咨询。销售自动化涵盖线索评分、跟进序列、非工作时间自动响应。项目管理通过 STATE.yaml 文件实现自动状态追踪。腾讯内部测试中，其 WorkBuddy（基于 OpenClaw）已覆盖 2,000+ 非技术员工。

"一人公司"模式

OpenClaw 在中国掀起了"零成本创业"浪潮。最引人注目的案例：一个名为"Felix"的 OpenClaw Agent 在获得 1,000 美元预算后，自主建立网站、创建信息产品、执行营销活动，3 周内产生了 14,718 美元收入。深圳龙岗区为"一人公司"提供最高 1,000 万元人民币补贴，无锡为 OpenClaw 驱动的机器人/工业应用突破提供最高 500 万元资助。

前沿实验场景

上海交通大学与国星宇航合作，通过轨道卫星推理使用 OpenClaw 远程控制人形机器人（太空计算实验）。Rain Protocol 整合 OpenClaw 构建预测市场平台（500 万美元赠款计划）。在争议性应用中，MoltMatch（AI 约会平台）引发了关于 Agent 自主行为边界的伦理讨论。

三、技术架构：以 Gateway 为核心的星形拓扑

OpenClaw 将 AI 助手视为基础设施问题而非提示工程问题——LLM 提供智能，OpenClaw 提供操作系统层：会话管理、记忆、工具沙箱、访问控制和消息路由。

整体架构设计

OpenClaw 采用以 Gateway 为中心的星形（Hub-and-Spoke）架构，由 pnpm 管理的 Monorepo 构成，核心包括六大模块：

包名	功能
`packages/core`	核心框架，Provider 接口，基础类（约 8MB）
`packages/gateway`	控制平面：WebSocket 服务器、会话管理、通道路由
`packages/agent`	Pi Agent 运行时，RPC 模式、工具流、块流
`packages/cli`	CLI 工具：引导配置、网关控制、消息发送
`packages/sdk`	自定义工具和插件开发 SDK
`packages/ui`	WebChat 界面和控制面板

Gateway：架构的心脏

Gateway（openclaw gateway）是整个系统的核心——一个长驻守护进程，在 ws://127.0.0.1:18789 上运行 WebSocket 服务器（默认仅绑定 localhost）。它负责维护与所有通讯平台的连接（WhatsApp 使用 Baileys、Telegram 使用 grammY、Discord 使用 discord.js 等），所有入站帧都通过 JSON Schema（由 TypeBox 定义生成）验证。每台主机只运行一个 Gateway 实例。

Wire 协议规范：WebSocket 文本帧 + JSON 载荷。首帧必须为 connect，请求格式为 {type:"req", id, method, params}，响应格式为 {type:"res", id, ok, payload|error}，副作用方法要求幂等性键。

六阶段消息处理流水线

这是 OpenClaw 处理每条用户消息的完整数据流：

Channel Adapter（通道适配器）：将不同平台的输入标准化为统一消息格式，提取附件
Gateway Server（网关服务器）：会话协调器，确定消息所属会话并分配到对应队列
Lane Queue（车道队列）：默认串行执行，仅对显式标记的低风险任务允许并行（防止竞态条件）
Agent Runner（Agent 运行器）：处理模型选择、API Key 轮换、提示组装、上下文窗口管理
Agentic Loop（推理-行动循环）：基于 ReAct（Reason + Act） 范式的迭代循环——模型提出工具调用 → 系统执行 → 结果回填 → 循环继续直至解决或触及限制
Response Delivery（响应交付）：流式回传至原始通道，持久化对话和记忆到工作区

记忆系统

OpenClaw 的持久记忆由三层组成：JSONL 转录文件（逐行审计日志）、Markdown 记忆文件（MEMORY.md，存储应被记住的内容）、混合搜索引擎（SQLite 嵌入向量的语义搜索 + FTS5 关键词精确匹配）。嵌入提供者可配置为 OpenAI、Gemini、Voyage 或本地模型。

系统提示词的动态组装

每次对话 turn 的系统提示词由多个来源动态拼接：AGENTS.md（核心操作基线）+ SOUL.md（人格与语气）+ TOOLS.md（用户特定工具约定）+ 符合条件的 Skills 指令 + 会话历史 + 语义搜索的记忆片段 + 自动生成的工具定义。

插件架构

OpenClaw 采用插件优先设计，甚至模型提供者也是外部包动态加载。插件类型包括：通道插件（新增通讯平台）、记忆插件（替代存储后端）、工具插件（自定义能力）、Provider 插件（自定义 LLM 提供者）。插件通过 package.json 的 openclaw.extensions 字段发现，经 Schema 验证后运行时热加载。

四、市场定位：开源 AI Agent 领域的绝对领跑者

市场规模与增长态势

OpenClaw 处于个人/自主 AI Agent 这一全新品类的中心。NVIDIA CEO 黄仁勋在 GTC 2026 上的表态最具定义性："Mac 和 Windows 是个人电脑的操作系统，OpenClaw 是个人 AI 的操作系统。" 这一表态引发了大规模股市连锁反应——智谱 AI 股价上涨 13%，MiniMax 上涨 22%，摩根士丹利发布了 "OpenClaw 投资指南"。

中国方面，科技巨头们的资本支出估计合计达 600 亿美元用于 AI 基础设施建设。171 家基于 OpenClaw 的初创公司被追踪，合计月收入 391,230 美元。

竞争格局

OpenClaw 面临的竞争对手可分为三个层级：

开源替代品：NanoClaw（轻量级、Docker 容器隔离）、ZeroClaw（Rust 编写、极速低资源）、PicoClaw（嵌入式 Linux/$10 硬件）、OpenFang（Rust 编写的"Agent 操作系统"，38 工具 + 40 通道，26,800+ Star）、Nanobot（Python 极简主义，基于 Anthropic Agent SDK）。

商业/托管方案：TrustClaw（托管云 Agent，OAuth + 沙箱，20,000+ 工具）、Knolli（无代码 AI Copilot）、Adopt AI（企业级合规治理）。

中国本土化产品：腾讯 QClaw/WorkBuddy（微信/QQ/企业微信/钉钉/飞书）、字节跳动 ArkClaw（火山引擎云 SaaS）、阿里 JVS Claw/CoPaw（钉钉集成）、小米 MiClaw（手机/智能家居）、智谱 AutoClaw、MiniMax MaxClaw、月之暗面 Kimi Claw、商汤"办公浣熊"、百度"龙虾家族"工具套件。

融资与商业模式

OpenClaw 本身是免费开源项目，Steinberger 个人每月投入 1-2 万美元维护。但生态系统融资活跃：Cline 为 OpenClaw 生态设立 100 万美元开源赠款计划（每项 1,000-10,000 美元），Toyo AI 融资 430 万美元（Frontline Ventures 领投）。中国多个城市推出专项补贴，深圳龙岗区为核心代码贡献者提供最高 200 万元奖励，还推出"OpenClaw 数字员工应用券"补贴部署成本的 40%。

安全风险：不可忽视的阴影

OpenClaw 的爆发式增长伴随着严重的安全隐患。全球 40,000+ 实例暴露在公网上，其中 12,000+ 被确认可通过 RCE 利用，30,000+ 安装被入侵。已发布 8 个 CVE，其中 CVE-2026-25253（CVSS 8.8）为通过 WebSocket 劫持的一键远程代码执行漏洞。ClawHub 上发现 800+ 恶意技能，Cisco 安全团队发现第三方技能执行数据窃取和提示注入，150 万 API 密钥和 35,000 封邮件在安全事件中泄露。Palo Alto Networks 称其为"安全噩梦"，中国政府已限制国家机关在工作设备上使用 OpenClaw。

五、OpenClaw 与 AI Agent 的关系：Agent 的操作系统层

OpenClaw 的本质定位

OpenClaw 既不是一个简单的 AI Agent 框架，也不仅仅是基础设施——它是 AI Agent 的操作系统。具体而言，LLM（如 Claude、GPT）提供"大脑"——推理、语言理解和决策能力，而 OpenClaw 提供"身体"——感知（通过 25+ 通讯渠道接收输入）、行动（通过 26+ 内置工具和 13,000+ 技能执行任务）、记忆（持久化上下文）、安全（沙箱和访问控制）。

这种分离设计的关键优势在于模型无关性：用户可以随时切换底层 LLM，而 Agent 的行为能力、连接的工具、积累的记忆都不受影响。

Agent 的 ReAct 推理循环

OpenClaw 的 Agent 运行时实现了经典的 ReAct（Reasoning + Acting） 范式。每个用户请求触发一个迭代循环：

LLM 接收用户消息 + 系统上下文 → 进行推理
LLM 决定需要调用哪些工具 → 输出工具调用请求
OpenClaw 执行工具调用（可能在 Docker 沙箱中）→ 返回结果
结果回填到 LLM 上下文 → LLM 继续推理
循环持续直至 LLM 认为任务完成或触及调用次数/token 限制

多 Agent 协作

OpenClaw 支持复杂的多 Agent 编排：

会话类型分层：main（直接对话）、dm:<channel>:<id>（私信会话）、group:<channel>:<id>（群组会话），每种都是独立的安全边界
Agent 委派架构：父 Agent 通过 sessions_spawn 创建子 Agent，子 Agent 在独立上下文中执行，结果回传父 Agent
自动化触发器：Cron 定时任务、Webhook 外部触发、Standing Orders（持久行为规则）、Hooks（事件驱动自动化）
A2UI（Agent-to-UI）：Agent 驱动的可视化工作区，使用声明式 HTML 创建交互界面（按钮点击 → 工具调用）

六、Skill 系统：教会 Agent 新能力的"教科书"

Skill 的定义与核心概念

Skill（技能）是 OpenClaw 中高层级的、面向用户的能力单元，编排一个或多个底层工具来完成特定任务。关键区分：工具（Tool）是低层级的构建块（读文件、执行命令），技能（Skill）是指导工具使用的知识和工作流（"如何使用 Google Workspace 完成复杂任务"）。

每个 Skill 本质上是一个目录，包含一个 SKILL.md 文件，由 YAML 前置元数据和 Markdown 指令组成，遵循 AgentSkills 规范。

SKILL.md 文件格式

---
name: image-lab
description: 通过 Provider 支持的图像工作流生成或编辑图像
metadata: {"openclaw": {"requires": {"bins": ["uv"], "env": ["GEMINI_API_KEY"]}, "primaryEnv": "GEMINI_API_KEY"}}
homepage: https://example.com
user-invocable: true
disable-model-invocation: false
---

# 使用说明
这里编写指导 Agent 如何使用该技能的详细 Markdown 指令。
使用 {baseDir} 引用技能目录路径。

加载机制与优先级

Skill 从三个位置加载，按优先级从高到低：

工作区技能（<workspace>/skills）——最高优先级
托管/本地技能（~/.openclaw/skills）——通过 ClawHub 安装
内置技能（随 npm 包发布）——最低优先级

可通过 openclaw.json 中的 skills.load.extraDirs 添加额外目录。

门控系统（Load-time Gating）

Skill 在加载时通过门控条件过滤：requires.bins（PATH 上必须存在特定二进制）、requires.anyBins（至少存在一个）、requires.env（环境变量必须存在）、requires.config（配置路径必须为真）、os（操作系统过滤）、always: true（跳过所有门控）。

ClawHub 技能注册中心

ClawHub 是官方技能市场，截至 2026 年 2 月底拥有 13,729+ 社区构建的技能，覆盖编程、写作、数据分析、DevOps、AI/ML、智能家居、生产力、健康、金融、通讯等类别。CLI 操作：clawhub install <skill-slug> 安装、clawhub update --all 更新。所有技能通过 VirusTotal 合作伙伴关系进行安全扫描。值得注意的是，Agent 还能按需自动创建新技能——用户描述需求，Agent 自主编写并安装 Skill。

Token 开销计算

每个 Skill 的 Token 开销约为：97 字符 + name 长度 + description 长度 + location 长度。总开销公式：total = 195 + Σ(97 + len(name) + len(description) + len(location))。

七、MCP 集成：连接万物的"USB-C"协议

MCP 在 OpenClaw 中的角色

MCP（Model Context Protocol，模型上下文协议） 被形容为 "AI 的 USB-C"——一个将 AI 模型连接到外部工具和数据源的开放标准。最初由 Anthropic 提出，现由 Linux 基金会下的 Agentic AI Foundation 治理。OpenClaw 通过 @modelcontextprotocol/sdk@1.25.3 实现了原生 MCP 支持。

MCP 在 OpenClaw 架构中充当外部能力桥梁：它让 Agent 能够调用数千个第三方服务——Notion、Linear、Stripe、GitHub、PostgreSQL、MySQL、SQLite、Google Drive、AWS S3 等，而无需为每个服务编写自定义集成。

工作原理

MCP 遵循客户端-服务器架构，使用 JSON-RPC 2.0 协议：

初始化：OpenClaw 启动时，Agent 运行时生成 MCP 服务器进程并执行能力协商
发现：客户端查询服务器提供哪些工具（Tools）、资源（Resources）和提示（Prompts）
调用：对话过程中，当 Agent 需要外部工具时，向对应 MCP 服务器发送调用请求

配置方式

在 openclaw.json 或工作区 .mcp.json 中配置，支持三种传输类型：

{
"mcpServers": {
"database-tools": {
"command": "node",
"args": ["~/.openclaw/servers/db-server.js"],
"env": { "DB_URL": "${DB_URL}" }
    },
"github": {
"type": "sse",
"url": "https://mcp.github.com/sse"
    },
"custom-api": {
"type": "http",
"url": "https://api.example.com",
"headers": { "Authorization": "Bearer ${API_TOKEN}" }
    }
  }
}

stdio 用于本地进程通讯，sse（Server-Sent Events）用于远程连接，http 用于 HTTP 端点。

MCP 与 Skill 的区分

两者可同时使用但定位不同：MCP 服务器是外部进程，通过 JSON-RPC 2.0 通讯，可跨平台移植（同一 MCP 服务器可被 Claude、ChatGPT、VS Code 使用）；Skill 是运行在 OpenClaw Agent 进程内的模块，能访问 OpenClaw 内部状态（记忆、会话），集成更紧密但不可移植。

MCP Bridge

社区项目 openclaw-mcp（GitHub: freema/openclaw-mcp）提供了一个桥接服务器，允许 Claude.ai 与 OpenClaw 通讯——支持 OAuth 2.1 认证、CORS 保护、输入验证、Docker 安全加固部署，甚至支持多实例模式编排多个 OpenClaw Gateway。

八、Tool Use 系统：Agent 的双手

内置工具全景

OpenClaw 提供 26 个内置工具，分为两层：

Layer 1——核心工具（8 个）：read（读文件）、write（写文件）、edit（编辑文件）、apply_patch（应用代码补丁）、exec（执行 Shell 命令）、web_search（Brave Search 网络搜索）、web_fetch（抓取网页内容并转 Markdown）、list（列出文件）。

Layer 2——高级工具（18 个）：browser（Chrome DevTools 控制：导航、点击、填表、截图、ARIA 快照）、canvas（Agent 驱动的可视化工作区）、memory_search/memory_get（记忆搜索与获取）、image（图像理解/生成）、会话管理五件套（sessions_list/history/send/spawn/status）、cron（定时任务）、gateway（网关控制）、message（消息发送）、nodes（设备节点控制：摄像头、屏幕、位置）、process/bash（后台进程管理）、llm_task/lobster（工作流引擎工具）。

工具组与配置

工具按功能分组管理，支持细粒度的 Allow/Deny 控制：

{
"tools": {
"allow": ["group:fs", "browser"],
"deny": ["exec"],
"profile": "coding"
  }
}

Deny 永远优先于 Allow。支持按 Agent 覆盖配置。预设的工具配置文件（如"coding"、"messaging"）设置基础白名单。

Tool Use 与 Skill、MCP 的三层关系

这三者构成 OpenClaw 能力体系的三个层级：

Tool（工具） 是最底层的原子操作——读写文件、执行命令、搜索网页。它们是 Agent "双手"的基本动作。
Skill（技能） 是中间层的编排知识——指导 Agent 如何组合多个工具完成复杂任务。Skill 不直接执行操作，而是通过 Markdown 指令告诉 Agent 应该使用哪些工具、按什么顺序、遵循什么规则。
MCP（模型上下文协议） 是扩展层的外部连接——将 Agent 的工具能力扩展到成千上万的第三方服务，且遵循标准化协议保证互操作性。

三者协同工作的典型流程：用户请求"帮我查询数据库中上月的销售数据并生成报告" → Agent 参考相关 Skill 了解工作流步骤 → 通过 MCP 连接 PostgreSQL 服务器执行 SQL 查询 → 使用内置 Tool（write）将结果写入文件 → 使用 Tool（message）将报告发送给用户。

安全机制

工具安全是 OpenClaw 最受关注的领域。exec 工具支持 Docker 沙箱（但默认关闭），提供三级审批模式：always（每条命令都需审批）、on-miss（新命令需审批）、never（不审批）。系统还实现了工具循环检测（可配置告警阈值 10 次、严重阈值 20 次、全局熔断 30 次），防止 Agent 陷入无限工具调用循环。Browser 工具通过沙箱浏览器桥接 + CDP（Chrome DevTools Protocol）通讯，支持 ARIA 语义快照（相比截图减少 90% Token 消耗）。

结论：新物种的机遇与风险并存

OpenClaw 代表了 AI Agent 从概念验证到大规模应用的关键转折点。它用不到 100 天的时间证明了自主 AI Agent 的巨大市场需求——从硅谷到深圳，从个人开发者到腾讯、NVIDIA 这样的科技巨头，整个行业都在围绕它构建生态。其架构设计的核心洞察——将 Agent 视为基础设施问题而非提示工程问题——使其成为真正的"AI 操作系统"而非又一个聊天机器人框架。

然而三个关键挑战不容回避。安全性仍是最大短板：40,000+ 暴露实例、8 个 CVE、150 万泄露的 API Key，这些数字表明当前的安全模型无法匹配项目的增长速度。治理转型存在不确定性：创始人加入 OpenAI 后项目移交独立基金会，过渡期的决策机制和方向尚不明朗。生态碎片化风险：中国市场出现了十余个本土化分叉（QClaw、ArkClaw、AutoClaw 等），短期内促进了采用，但长期可能导致标准分裂。对于任何考虑采用 OpenClaw 的组织，在充分理解安全模型并实施纵深防御之前，不建议在生产环境中部署——这不仅是 OpenClaw 的问题，更是整个自主 AI Agent 品类在 2026 年面临的核心挑战。