乐于分享
好东西不私藏

【OpenClaw 全面解析:从零到精通】第 002 篇:解剖“龙虾“—— 核心技术原理全解析

【OpenClaw 全面解析:从零到精通】第 002 篇:解剖“龙虾“—— 核心技术原理全解析


系列说明:本系列共计 20 余篇,全面介绍 OpenClaw 开源 AI 智能体框架。本文为系列第 002 篇,聚焦于 OpenClaw 的核心技术架构与工作原理。建议先阅读 第 001 篇:OpenClaw 的诞生与历史背景。


摘要

OpenClaw 采用独特的”三层解耦”架构,将系统分为 Gateway 网关层、Agent 智能体层和 Channels 渠道层。核心 Agent 基于”Lobster Loop”(龙虾循环)实现思考-执行-观察-反馈的闭环自主行动。本文深入解析 OpenClaw 各核心组件的设计哲学与技术实现,帮助读者从原理层面理解这一 AI 智能体框架的运作机制。


一、架构全景:一张图看懂 OpenClaw

在深入细节之前,我们先从整体上把握 OpenClaw 的架构设计。

OpenClaw 的整个系统可以用一个简洁的比喻来理解:如果把 OpenClaw 比作一个有机体,那么:

  • Gateway(网关)
     是它的神经中枢,负责协调所有信号的传递和路由
  • Agent(智能体)
     是它的大脑,负责思考、决策和规划
  • Skills(技能)
     是它的手脚,是真正与现实世界交互的执行单元
  • Channels(渠道)
     是它的感官,负责接收来自不同平台的输入
  • Nodes(节点)
     是它分布在各处的末梢神经,提供本地设备能力

这五个核心组件共同构成了 OpenClaw 的”身体”,而连接它们的则是基于 WebSocket 的实时通信总线。

┌─────────────────────────────────────────────────────────┐│                    OpenClaw 系统架构                      │├─────────────────────────────────────────────────────────┤│                                                         ││   Channels (渠道层)                                      ││   WhatsApp | Telegram | Discord | 飞书 | iMessage | ...  ││                           │                             ││                    ┌──────▼──────┐                      ││                    │   Gateway   │  ← 神经中枢           ││                    │ :18789/ws   │  (WebSocket服务器)    ││                    └──────┬──────┘                      ││                           │                             ││              ┌────────────┼────────────┐                ││              ▼            ▼            ▼                ││           Agent        Memory        Skills             ││          (大脑)       (记忆系统)     (手脚执行)           ││              │                                          ││           LLM API                                       ││     (GPT/Claude/本地模型)                                ││                                                         ││   Nodes (分布式节点)                                     ││   Mac | Linux | Raspberry Pi | Phone                    │└─────────────────────────────────────────────────────────┘

二、Gateway 网关层:系统的”神经中枢”

Gateway 是 OpenClaw 架构中最关键的组件,也是整个系统的协调核心。

2.1 技术实现

Gateway 本质上是一个基于 Node.js v22+ 构建的常驻后台守护进程(Daemon Process),默认监听在 127.0.0.1:18789 端口,通过 WebSocket 全双工通信协议与系统各组件保持长连接。

# Gateway 进程运行状态示例 netstat -tlnp | grep 18789tcp  0  0  127.0.0.1:18789  0.0.0.0:*  LISTEN  1234/node

Gateway 的核心职责包括:

① 连接管理:维护所有 Channels、Agents、Nodes 与 Gateway 之间的 WebSocket 长连接,处理连接的建立、心跳保活与断线重连。

② 消息路由:接收来自各 Channel 的用户输入,根据路由规则分发给对应的 Agent 处理;将 Agent 的输出结果路由回对应的 Channel 进行回复。

③ 会话管理:维护跨平台的会话状态,同一用户在不同渠道(如先在 WhatsApp 问了一个问题,再在 Telegram 继续追问)可以共享同一个会话上下文。

④ 权限与认证:处理设备注册、API Key 验证、工具调用权限检查等安全相关事务。

⑤ 记忆系统托管:Gateway 负责管理 Agent 的长期记忆存储,包括对话历史的持久化和检索。

2.2 消息协议

Gateway 内部采用严格定义的消息协议,通过 TypeBox Schema 进行数据校验,支持三种消息类型:

消息类型
用途
示例场景
req

(请求)
发起一次调用或任务请求
用户发送消息、工具调用请求
res

(响应)
对请求的同步回复
Agent 回复、工具执行结果
event

(事件)
异步状态通知
任务进度更新、系统状态变化

这种标准化的消息协议设计,是 OpenClaw 能够灵活支持多种接入方式和扩展能力的基础。


三、Agent 智能体层:系统的”大脑”

Agent 是 OpenClaw 的核心决策单元,负责理解用户意图、制定执行计划并调用各类工具完成任务。

3.1 Lobster Loop:龙虾循环

OpenClaw 最具创新性的设计之一是其 Agent 的执行循环机制——Lobster Loop(龙虾循环),也被称为 Pi Agent 运行时。这一循环实现了 AI 智能体的”感知-规划-执行-反馈”闭环,包含四个核心步骤:

┌─────────────────────────────────────────────┐│              Lobster Loop(龙虾循环)          ││                                             ││   ┌─────────┐    ┌─────────┐               ││   │  Think  │───▶│   Act   │               ││   │  (思考)  │    │  (执行)  │               ││   └────▲────┘    └────┬────┘               ││        │              │                    ││   ┌────┴────┐    ┌────▼────┐               ││   │ Reflect │◀───│ Observe │               ││   │  (反馈)  │    │  (观察)  │               ││   └─────────┘    └─────────┘               │└─────────────────────────────────────────────┘

① Think(思考):Agent 将用户请求、会话历史、系统提示词和可用工具列表一并发送给 LLM,LLM 输出下一步的行动计划(通常是一系列结构化的工具调用指令)。

② Act(执行):Agent Runtime 解析 LLM 的输出,执行对应的工具调用,例如读写文件、执行 Shell 命令、调用外部 API 等。

③ Observe(观察):收集工具执行的结果,包括成功输出、错误信息、副作用等,构建观察报告。

④ Reflect(反馈):将观察结果追加到上下文中,判断任务是否完成。如未完成,则回到 Think 步骤,开始新一轮循环;如已完成,则生成最终回复返回给用户。

这种循环机制赋予了 OpenClaw 强大的自主任务执行能力,使其能够处理需要多步骤操作的复杂任务,而不仅仅是简单的问答。

3.2 系统提示词工程

每个 OpenClaw Agent 都有一个精心设计的系统提示词(System Prompt),它定义了 Agent 的:

  • 人格与角色
    :Agent 的名称、性格特点、工作方式
  • 核心指令
    :Agent 应该如何行动、优先级排序
  • 可用工具列表
    :当前 Agent 拥有哪些工具(Skills)
  • 记忆注入
    :相关的历史对话和长期记忆片段

系统提示词采用动态组装机制:在每次 LLM 调用之前,Gateway 会根据当前上下文(当前渠道、任务类型、用户偏好等)动态构建最优的系统提示词,而不是使用固定的静态提示词。这一设计大幅提升了 Agent 在不同场景下的表现一致性。

3.3 多 Agent 协作

OpenClaw 支持配置多个独立的 Agent,每个 Agent 可以有不同的专长、权限和工具集。通过路由配置,不同来源的请求可以被分发给最合适的 Agent 处理,实现任务委托负载均衡


四、Skills 技能系统:系统的”手脚”

如果说 Agent 是 OpenClaw 的大脑,那么 Skills(技能)就是它真正与现实世界交互的手脚。

4.1 Skills 的定义方式

每个 Skill 由一个标准化的 SKILL.md 文件定义,这是 OpenClaw 最精妙的设计之一——用人类可读的 Markdown 格式来定义 AI 可执行的工具,既方便人类理解和修改,也方便 LLM 在推理时理解工具的用途。

一个典型的 SKILL.md 文件结构如下:

---name: file-managerdescription: 文件系统操作技能,可以读写文件、创建目录、搜索内容version: 1.0.0author: communitypermissions:  - file:read  - file:write---# File Manager Skill## 可用工具### read_file读取指定路径的文件内容。参数:path (string) - 文件路径### write_file将内容写入指定路径的文件。参数:path (string), content (string)### search_files在目录中搜索包含特定内容的文件。参数:directory (string), query (string)

4.2 内置 Skills 与 ClawHub

OpenClaw 内置了一批核心 Skills,涵盖最常用的操作:

Skill 类别
主要功能
文件系统
读写文件、目录管理、文件搜索
终端命令
执行 Shell 命令、脚本运行
浏览器自动化
网页浏览、表单填写、内容抓取
记忆管理
创建/检索长期记忆、笔记管理
系统集成
日历管理、通讯录、通知推送

除内置 Skills 外,ClawHub 作为社区技能市场,提供了超过 1 万个由社区贡献的扩展 Skill,覆盖从代码审查、数据分析到电商运营、内容创作等几乎所有主流使用场景。用户可以像安装 npm 包一样,一键安装所需的 Skill:

# 安装一个社区 Skillopenclaw skill install web-searchopenclaw skill install notion-syncopenclaw skill install github-assistant

4.3 技能权限与安全沙盒

每个 Skill 都需要声明所需的权限(如 file:readnetwork:httpshell:execute),Agent 只能调用其权限范围内的工具。

对于高风险的工具调用(如执行 Shell 命令、删除文件),OpenClaw 提供了命令审批机制:在执行前向用户展示将要执行的操作,用户确认后才会真正执行。这一机制在实用性与安全性之间取得了良好平衡。


五、Channels 渠道层:系统的”感官”

Channels 层是用户与 OpenClaw 交互的入口,支持超过 20 种通信平台

渠道类型
支持平台
即时通讯
WhatsApp、Telegram、Discord、Signal
企业协作
飞书、Slack、Microsoft Teams、钉钉
苹果生态
iMessage(macOS 专属)
命令行
CLI(所有平台均支持)
桌面客户端
macOS 菜单栏客户端(Beta)
Web 界面
Web UI(开发中)

每个渠道通过对应的适配器与 Gateway 连接,适配器负责处理各平台的协议差异,统一转化为 OpenClaw 内部标准消息格式。例如:

  • WhatsApp 适配器
    基于开源的 Baileys 协议库实现
  • Telegram 适配器
    基于 grammY 框架
  • Discord 适配器
    基于 discord.js 库
  • 飞书适配器
    通过飞书开放平台 API 实现

5.1 跨渠道会话共享

OpenClaw 支持跨渠道的会话上下文共享。用户可以在 Telegram 上开始一个任务,在 WhatsApp 上继续,在命令行中查看进度——三个入口共享同一个会话状态,实现了真正意义上的”全渠道 AI 助手”体验。


六、记忆系统:让 AI 真正”记住”你

OpenClaw 的记忆系统是其超越普通聊天机器人的关键能力之一。它采用”文件即真相(File-as-Truth)“的设计哲学,以 Markdown 格式将记忆存储在本地文件系统中。

6.1 记忆的分层结构

memory/├── daily/│   ├── 2026-03-16.md    # 今日对话日志│   └── 2026-03-15.md    # 昨日对话日志├── long-term/│   ├── user-profile.md  # 用户偏好和习惯│   ├── projects.md      # 项目相关知识│   └── contacts.md      # 联系人信息└── working-memory/    └── current-task.md  # 当前任务上下文

6.2 语义检索

OpenClaw 引入了向量语义搜索能力(基于 OpenAI text-embedding 模型或本地 Embedding 模型),能够在海量历史记忆中快速检索与当前对话相关的内容,将相关记忆片段动态注入系统提示词,实现真正的”长期记忆”效果。


七、本地优先架构的安全设计

OpenClaw 的”本地优先”不只是一句口号,而是贯穿整个架构设计的核心原则:

数据存储:所有对话记录、记忆文件、配置信息默认存储在用户本地的 ~/.openclaw/ 目录,不上传至任何云端服务器。

模型 API 代理:当使用云端 LLM(如 GPT、Claude)时,API 请求由用户自己的密钥发起,OpenClaw 的服务器不经手任何对话内容。

Gateway 本地化:Gateway 默认只监听 127.0.0.1(localhost),外部网络无法直接访问,从源头上规避了远程攻击风险。

Docker 沙盒隔离:对于需要执行高风险操作的 Agent,OpenClaw 支持将其运行在 Docker 容器中,通过容器级别的资源隔离保护宿主机安全。


八、技术栈总结

层次
技术选型
说明
运行时
Node.js v22+
基础运行环境,LTS 长期支持版本
包管理
pnpm
高性能包管理器,节省磁盘空间
通信协议
WebSocket
Gateway 与各组件的全双工通信
数据校验
TypeBox
TypeScript 运行时类型校验
向量搜索
OpenAI Embeddings / 本地模型
语义记忆检索
浏览器自动化
Chromium + CDP
网页操作能力支持
容器化
Docker
安全沙盒隔离
存储格式
Markdown
人类可读的记忆与技能定义格式
LLM 支持
OpenAI / Anthropic / 阿里 / 豆包等
多模型灵活接入

九、架构设计的哲学思考

OpenClaw 的架构之所以能够在短时间内赢得如此众多开发者的青睐,很大程度上源于其背后清晰的工程哲学

简单而非简陋:架构足够简单,让开发者能快速理解;但在简单之下,每个设计决策都经过深思熟虑,具备足够的扩展空间。

解耦而非孤立:三层解耦让各组件可以独立演进,但通过标准化的 WebSocket 协议和消息格式保持紧密协作。

安全而非封闭:在提供强大执行能力的同时,通过权限系统、审批机制和沙盒隔离确保安全,而不是以限制功能换取安全。

社区而非封闭:SKILL.md 的开放格式和 ClawHub 的生态市场,让整个系统能够借助社区力量无限扩展能力边界。

这些哲学,正是 OpenClaw 能够从众多 AI 工具中脱颖而出的深层原因。


十、小结

本文系统解析了 OpenClaw 的核心技术架构,涵盖 Gateway 网关层、Agent 智能体层(Lobster Loop)、Skills 技能系统、Channels 渠道层和记忆系统五大核心组件。这种”三层解耦 + 闭环执行”的设计,是 OpenClaw 能够实现 AI 自主执行能力的技术基础。

掌握了这些原理,读者将能更好地理解后续文章中关于安装配置、功能使用和高级开发的内容。


参考资料

  1. OpenClaw 官方文档
  2. OpenClaw 技术架构深度解析 – CSDN
  3. OpenClaw 系统架构分析 – CSDN
  4. OpenClaw 源码深度解读 – CSDN
  5. OpenClaw 完全指南:从原理到实现 – 搜狐
  6. OpenClaw 架构解析 – CSDN