解析 OpenClaw:剥开“龙虾”的外壳(上)-夜雨聆风

解析 OpenClaw:剥开“龙虾”的外壳(上)

一、简介

OpenClaw（曾用名 ClawdBot、Moltbot，社区昵称 “龙虾”）是一个适用于全主流操作系统的 AI 智能体网关。它不生产大模型，它只是大模型的搬运工。它以一个中间件的身份，将大模型、主流聊天平台、本地执行环境连接起来，把微信、钉钉等主流聊天平台转化为 AI 的调用入口，简化人与 AI 的协作交互流程。

用户无需额外安装客户端或访问特定网站，只需通过聊天平台使用自然语言向 AI 发起对话，即可快速获取 AI 响应。并且 OpenClaw 突破了文本交互的约束，支持 AI 根据自然语言指令直接执行本地操作，包括但不限于运行系统命令、操控浏览器、编写与运行代码、管理文件等复杂任务，真正实现 “语言即控制” 的端到端智能体执行能力。看过《钢铁侠》吗？主角托尼・斯塔克有一个超级管家 “贾维斯”，能帮他处理一切事务；而 OpenClaw 就是一个可私有化部署、完全自主可控的开源版 “贾维斯”。无论你身在何处，只要通过已接入的聊天平台下达自然语言指令，它就会自动完成意图解析、任务规划、工具调用、执行落地，并将最终结果原路反馈给你。

无论是Claude Code、还是龙虾，或者是更早的Manus，本质上都是同一类产品，或者说市场定位类似，都可以归类为通用智能体。虽然这些产品在技术路径和架构设计上各有差异，但本质上要解决的问题却是高度一致。

1、传统 AI 助手的痛点

在 OpenClaw 这类产品出现之前，传统 AI 助手存在四大核心痛点，严重限制了其实际落地价值：

被困在网页或客户端里：AI 能力被封闭在特定网页或专属客户端中，用户必须打开指定网站、安装专属软件才能使用，无法融入日常工作流，协作流程繁琐。
只能”说”不能”做”：AI 只能进行文本交互、给出方案建议，但不能实际帮你执行任务，比如不能帮你运行命令、修改文件等，需用户手动完成执行。
数据安全风险：用户的对话记录、个人偏好、业务数据等核心信息，均由AI服务提供商集中存储，用户无法自主掌控数据流向与隐私安全。
无法定制和扩展：功能由服务商固定设定，不支持个性化修改与扩展，难以满足不同用户的定制化需求，灵活性不足。

2、OpenClaw 的解决方案

OpenClaw 以本地部署的 AI 智能体网关为核心，从四个维度针对性解决上述问题：

统一多平台入口：通过一个统一的网关，灵活接入微信、钉钉等主流聊天平台，打破平台壁垒，实现“一处部署、全渠道可用”。
全场景任务执行：突破纯文本交互限制，支持 Shell 命令运行、浏览器自动化控制、文件读写、邮件发送、日程管理等本地的执行能力。
用户数据本地化：全程运行于用户个人电脑或私有服务器，对话记录、个人偏好等用户数据去全部本地存储，从根源上保障隐私安全。
开源和可扩展：基于 MIT 开源协议，支持用户自由修改、二次开发，且通过 Skills 技能系统，可灵活定制、扩展 AI 能力，适配个性化需求。

3、综合对比

二、关键概念

1、Gateway（网关）

专业解释：Gateway 是 OpenClaw 的核心进程，是一个基于 WebSocket 的服务（默认端口18789），承担着整个系统的核心调度与通信枢纽职责，涵盖消息路由分发、会话生命周期管理、大模型与工具链调用等任务，是连接聊天平台适配器、大模型、本地工具的通信桥梁。

通俗理解：Gateway 就像是 OpenClaw 的智能接线员！全年无休，24 小时待命，负责接收来自不同渠道（聊天平台）的“需求指令”，然后快速解析识别并精准地分发给对应的“执行部门”（大模型或本地工具）处理，待处理完成后，再将处理结果原路反馈给用户。

关键特性：

统一控制节点：一套 OpenClaw 系统只有一个 Gateway，是系统唯一的调度中枢，所有请求与数据交互均需通过 Gateway 统一处理。
后台常驻运行：以系统服务形式在后台静默运行，支持开机自启，可实现 7×24 小时无间断服务。
智能消息路由：可根据消息来源、类型、表示等维度进行分类，将对话消息精准分配至对应的处理模块，并将处理结果返回给对应会话。
持久状态管理：本地持久化存储所有会话的历史记录、用户配置和实时状态等信息，确保多轮对话的上下文连贯性与可追溯性，同时全程数据本地留存，保障数据隐私。

2、Nodes（节点）

专业解释：Nodes 是 OpenClaw 中通过 WebSocket 长连接（远端节点）或本地进程调用（本地节点）与 Gateway 建立通信、完成注册鉴权的终端设备或服务实例，是 Skill 的实际执行载体，用于向系统提供可调用的特定能力、硬件资源或访问权限（如调用摄像头、访问 GPU、读写本地文件等）。每个 Node 在接入 OpenClaw 之前，都需要通过标准握手流程完成鉴权与能力声明，主动向 Gateway 上报自身设备身份、核心能力清单、权限范围、资源状态等信息。流程通过后纳入系统的统一管理体系，接受 Gateway 下发的任务指令和调度安排，并实时向 Gateway 反馈任务执行状态、资源占用情况。

通俗理解：想象 Gateway 是中央大脑，Nodes 就是四肢和感官，大脑只负责决策、指令拆解和分配任务，不直接执行任何具体操作；所有需要硬件支持、专属权限、算力支撑的具体执行动作，都由对应的 Node 完成。例如办公电脑是一个桌面节点，能提供 GPU 计算、本地文件管理、桌面应用操控等能力。Gateway 可根据具体任务需求，随时调度一个或多个 Node 协同配合，组合完成复杂的综合任务

常见 Node 类型：

本地节点（Local Node）：与 Gateway 运行在同一台机器上，是系统默认的执行节点，无需额外配置即可提供本机系统命令运行、文件读写、应用操控等核心能力，是 OpenClaw 开箱即用的基础执行载体；
移动终端节点（iOS/Android手机）：提供摄像头、麦克风、定位服务等移动端能力，适配移动场景下的轻量化任务与实时交互需求。
桌面 / 专属系统节点（macOS/Windows电脑）：提供系统独有服务（如 macOS iMessage 集成）、桌面应用操控等平台化能力，适配桌面场景下的专业操作与本地资源管理需求。
算力服务节点：提供 GPU 并行计算、AI 本地模型推理、大数据处理、密集型运算等高性能算力资源，适配算力密集型场景。
IoT / 边缘设备节点：运行在智能家居、传感器等边缘设备上的轻量节点，可实现物理世界的设备操控、数据采集、自动化控制，拓展了 OpenClaw 的物理世界交互边界。

3、Channels（渠道）

专业解释：Channels 是 OpenClaw 与外部消息平台之间的协议适配层（Adapter Layer），是实现跨平台消息互通的基础。由于不同的聊天平台使用不同的底层协议，且消息数据结构、接口规范和权限校验逻辑也各不相同，天然存在沟通壁垒。而每个聊天平台都可以通过一个专属的 Channel Adapter，来处理该平台特有的接入流程与通信规则，包括身份认证、事件订阅、消息收发、消息格式转换、媒体上传下载等。通过 Channels 的封装处理，OpenClaw 解决了不同平台间的通信壁垒，为上层业务提供了统一、标准化的交互接口。上层业务无需针对不同平台单独开发适配逻辑，只需基于统一接口开发，即可实现一次开发、全平台适配。

通俗理解：可以把 Channels 想象成一个“全能翻译官”，每个聊天平台就是一个说不同语言的“国家”，“微信国”有自己的语言和语法，“钉钉国”、“f飞书国”也各有一套“说话规则”，他们之间无法直接互通交流。而 Channels 的核心作用就是把这些不同的语言，都翻译成 OpenClaw 能统一理解的通用语言，确保系统能准确理解并正确执行；同时，也会把 OpenClaw 的处理结果，翻译成各个聊天平台能识别的本国语言，确保结果能正确回复和显示。此外，这个“翻译官”还会负责“对接事宜”，比如使用不同的API，验证 OpenClaw 在各个平台的身份、监控平台连接状态、处理消息发送失败的情况等事宜。这样一来，OpenClaw 只需使用一种通用语言即可与所有平台沟通，而底层的协议差异、格式差异、交互差异等，都被 Channels 屏蔽掉了，上层业务模块完全不用关心不同平台的区别。

4、Skills（技能）

专业解释：Skills 是 OpenClaw 的模块化能力扩展机制，是将提示词工程 (Prompt Engineering) 与工具调用 (Tool Execution) 结合的标准化封装。其核心定位是为通用智能体提供一套标准化的「技能包」封装与调用协议，实现专业知识、工作流程、工具调用逻辑的模块化、可移植、可复用，彻底解决传统 Agent 能力与平台强耦合、难以迁移复用的痛点。

通俗理解：想象 Openclaw 是一个极度聪明但刚入职的“资深高T”员工，它懂很多高深专业知识，但还不知道如何操作你公司的内部系统，不知道怎么按当前团队的规范写代码，只能自由发挥，结果自然也就好坏参半。而 Skills 就是给这位员工的操作手册和规范文档，文档中写明了内部系统的操作流程、团队代码规范等信息，让其能够根据手册文档，快速掌握对应的技能，让其按照正确的方向进行发挥，出现好结果的可能性大大提升。

核心价值：

在没有 Skills 的情况下，大模型往往只能依赖通用理解去“猜”你的意图。而有了 Skills ，就可以把一些具体的经验、流程和规范显式地沉淀下来，让大模型：

知道某类任务应该如何拆解。
知道优先使用哪些工具。
知道输出应该遵循什么格式。
知道有哪些边界、限制和注意事项。
知道怎样更贴近你的业务场景和团队习惯。

可以理解为：Skill 的价值除了“增加技能”之外，更重要的是让大模型在面对具体任务时，能够以更稳定、更专业、更符合预期的方式工作。

适用场景：

外部工具接入：让大模型学会如何正确使用某个外部系统或接口。
工作流程固化：把团队常见流程沉淀为可复用能力。
领域知识增强：让大模型更懂某个专业领域的术语、规则和步骤。
个性化定制：让大模型更符合个人/组织的使用习惯。

官方规范：

一个标准的 Skill 本质是一个文件夹，唯一强制项为根目录下的 SKILL.md，除此之外，还有诸多可选扩展目录，常见的有：

skill-identifier/          # 目录名=name字段（严格一致）├──SKILL.md               # ✅必需：元数据+执行指令（核心）├──scripts/               # 可选：可执行脚本（Python/Shell/JS等）├──references/            # 可选：领域文档、API手册、标准规范├──assets/                # 可选：模板、CSV、图片、配置文件等静态资源└──sub-skills/            # 可选：子技能集合（复杂任务拆分）

SKILL.md文件使用 YAML frontmatter + Markdown 指令正文的标准格式编写。其中 YAML frontmatter 用于定义技能的元信息（如技能名称、适用场景、依赖工具等），Markdown 指令正文则详细规定了 AI 如何调用特定工具、执行特定类型的任务。

元信息：

YAML frontmatter 定义的元信息，拥有以下必填字段和常见可选字段：

指令正文：

Markdown 指令正文是自然语言 SOP（标准作业程序），是对应技能的核心执行逻辑，通常包含以下内容：

使用场景（Usage）：明确触发条件与适用边界
分步执行步骤（Steps）：逻辑严谨、无歧义、可复现
输入 / 输出（Input/Output）：明确参数格式与结果规范
错误处理（Error Handling）：异常、边界、失败的处理逻辑
示例（Examples）：典型输入输出对（Few-Shot 增强稳定性）

基础模板：

---# 技能元数据（YAML 格式，必须放在最顶部）# 严格遵循 AgentSkills 规范，兼容 OpenClaw / Cursor / Claude Codename: 技能英文标识description: 清晰说明技能功能version: 1.0.0author: 作者名称tags:  - 标签1  - 标签2  - 工具类---# 技能名称## 技能用途本技能的核心目标、解决的问题、提供的能力。## 适用场景什么情况下应该使用本技能（触发条件）。## 不适用场景明确禁止/不推荐使用的场景。## 输入要求需要用户提供哪些信息、参数、格式。## 输出要求输出格式、风格、长度、结构、语言要求。## 执行流程AI 执行本技能的标准步骤（分点说明）。## 工具调用规则调用外部工具、API、命令行时的规则、权限、依赖。## 约束条件边界限制、安全规则、敏感操作、异常处理规则。## 使用示例提供真实可运行的输入 → 输出样例，方便 AI 理解。

具体示例：

---name: getWeatherdescription: 提供国内主要城市的实时气象数据、当日及未来3天短期天气预报，覆盖温度、天气状况、风力风向、湿度等核心信息，适配出行、穿搭、户外活动等生活场景的气象查询需求。version: 1.0.0author: 猪猪侠tags:  - 天气查询  - 生活工具  - 出行参考---# 天气查询技能## 技能用途为用户提供国内主要城市的实时气象数据、当日及未来3天短期天气预报，覆盖温度、天气状况、风力风向、湿度等核心信息。## 适用场景1.用户主动询问指定城市的实时温度、天气状况、风力湿度等基础气象信息2.用户需要出行、通勤、旅游、户外运动等场景的气象参考与配套建议3.用户询问当日及未来3天的短期天气预报，规划近期行程与活动安排4.用户仅提供城市名称，无额外限定条件，默认查询该城市当日实时天气5.用户询问对应天气下的穿衣搭配、出行注意事项等衍生生活需求## 不适用场景1.不提供历史气象数据回溯、未来4天及以上的中长期天气预报服务2.不支持境外非主要城市、国内县级市以下行政区域的精准气象查询3.不提供气象灾害预警、应急避险提示、专业气象科研数据等官方专项服务4.不支持经纬度、IP地址、自动定位的静默查询，仅处理用户主动提供的城市名称查询5.不提供农业、工业、航运、航空等专业领域的行业气象数据与决策建议6.不处理多城市批量天气对比、极端天气概率预测等非标准化查询需求## 输入要求1.必填参数：city_name，数据类型为字符串，格式为国内主要城市的中文全称/简称、全拼/简拼，支持「省+市」层级格式，无默认值2.可选参数：query_date，数据类型为字符串，格式为YYYY-MM-DD，取值范围为「当日至未来3天」，默认为系统当日日期3.若用户输入存在重名城市（如西安市vs西安镇），需先向用户确认精准行政区域，再执行查询## 执行流程1.解析用户自然语言指令，精准识别天气查询意图，提取 city_name、query_date 等核心参数2.若无有效 city_name ，触发标准引导话术，明确提示用户提供目标城市名称；若城市名称存在歧义/重名，向用户确认精准行政区域，获取明确信息后再进入下一步3.调用天气 API 获取实时数据，请求仅携带查询必需的城市参数，设置3s超时阈值，无重复调用、无冗余请求4.对接口返回数据进行合规清洗，仅保留授权范围内的气象指标，校验数据完整性与有效性，剔除异常值与非需求数据5.按照标准输出模板，整理为用户易读的中文文本；若用户有穿搭、出行等衍生需求，配套补充对应基础建议## 工具调用规则1. 优先选用国内具备ICP备案、合规运营的官方气象相关平台公开接口，严禁调用无资质、高风险、无用户协议的第三方接口2. 单用户单次查询仅发起1次接口请求，单日单用户调用次数不超过公开接口的免费频次限制，无恶意刷量、无循环调用行为3. 全流程节点触发异常时，匹配对应场景的标准友好提示，明确告知用户问题原因与解决建议，无空白返回、无报错信息透传## 输出要求### 1. 基础输出模板（实时天气，默认场景）【XX市】实时气象信息▸ 当前温度：XX℃▸ 体感温度：XX℃▸ 天气状况：XX（晴/多云/阴/雨/雪等）▸ 风向风力：XX风 X级▸ 相对湿度：XX%### 2. 扩展输出模板（短期预报/带场景需求）【XX市】20XX-XX-XX 天气预报▸ 天气状况：XX▸ 温度范围：XX℃ ~ XX℃▸ 风向风力：XX风 X级▸ 降水概率：XX%【出行/穿衣建议】XXXXXXXXXX### 3. 格式与内容要求- 统一使用中文简体，表述口语化、无专业晦涩术语，易读易懂- 禁用复杂表格、图片、Markdown高阶格式，仅使用基础换行与项目符号- 单次查询仅返回1个目标城市的结果，不冗余输出非用户请求的内容- 数值类信息保留整数位，无多余小数，单位标注清晰规范，无歧义- 不输出广告、第三方产品推荐、未经证实的气象相关言论，不编造、夸大气象数据- 若用户询问气象预警、灾害相关内容，必须明确提示「相关信息请以国家气象部门官方发布为准」，不替代官方发布专项信息## 约束条件1.严格遵循《中华人民共和国个人信息保护法》，绝不收集、存储、传输、共享用户的地理位置、个人身份等任何隐私信息2.仅执行天气查询相关的合规接口调用，无任何系统命令执行、文件读写、网络越权访问行为3.仅输出授权范围内的气象数据，不篡改、不编造、不隐瞒气象数据异常情况## 使用示例### 示例1：基础实时天气查询- 输入：北京今天天气怎么样？- 输出：【北京市】实时气象信息▸ 当前温度：18℃▸ 体感温度：17℃▸ 天气状况：晴▸ 风向风力：南风 2级▸ 相对湿度：45%### 示例2：带日期的短期预报查询- 输入：深圳后天的天气- 输出：【深圳市】2026-04-23 天气预报▸ 天气状况：多云转小雨▸ 温度范围：22℃ ~ 28℃▸ 风向风力：东风 3级▸ 降水概率：60%【出行建议】后天有降雨，出门请携带雨具，早晚温差略大，建议搭配薄外套。

加载优先级：

Skill 采用三级优先级机制，当多个 Skill 触发、存在同名或功能冲突时，OpenClaw 会按照优先级从高到低加载，高优先级 Skill 会自动覆盖低优先级的同名 / 冲突 Skill。优先级从高到低排序为：

Workspace Skills：<workspace>/skills/，最高优先级，面向当前工作区，适合放项目专属、团队专属、任务专属的 Skills。
Managed Skills：~/.openclaw/skills/，中等优先级，面向当前用户，所有 Agent 可共享，适合放个人常用的 Skills。
Bundled Skills：安装包内置，最低优先级，系统自带的基础 Skills，适合作为默认能力和通用模板。

补充：如果同优先级的两个 Skill 出现功能冲突，OpenClaw 会同时加载这两个 Skill，最终以加载完成更晚的 Skill 生效；二者会相互污染执行上下文，大概率导致执行过程异常。

ClawHub:

ClawHub 是 OpenClaw 的 Skills 社区注册表，类似于 npm 之于 Node.js。网站地址：https://clawhub.com，可以在其中搜索并安装别人写好的Skills 。

常见命令行操作：

# 搜索 Skillnpx clawhub search "youtube"# 安装 Skillnpx clawhub install summarize# 更新所有已安装的 Skillsnpx clawhub update --all# 发布你自己的 Skillnpx clawhub sync --all

5. Session（会话）

专业解释：Session 是 OpenClaw 的上下文隔离单元 (Context Isolation Unit)，是保障多场景交互隔离、权限精细化管控、运行时安全防护的底层设计。每个 Session 均为独立的上下文隔离单元，都拥有独立的对话历史、工具权限、文件访问边界以及沙箱执行策略等，用来确保不同来源、不同场景、不同信任等级下的交互彼此隔离、上下文互不污染。

通俗理解：把 OpenClaw 想象成一栋办公楼，那 Session 就是一个个不同的办公室。每个办公室都有专属 “监控记录”（对话历史，记录在这里发生的所有对话）、专属的 “工作权限”（能使用哪些办公工具、能做哪些操作），还有专属的 “隔音玻璃墙”（沙箱策略，防止其他办公室的信息闯入，也防止自己的信息泄露出去），它们之间互不干扰，相互独立。

Session ID:

每个 Session 对应全局唯一的 Session ID ，该 ID 采用URN（统一资源名称）结构化命名空间规范，它直接编码了来源、协议和信任边界等关键信息到字符串中，ID 标准格式通常为：[命名空间]:[所属主体]:[来源平台]:[会话类型]:[唯一标识] ，例如：agent:main:whatsapp:dm:+123456789 。

会话类型：

OpenClaw 基于「信任等级 – 来源风险 – 权限范围」三维度，划分了三类核心会话类型，每种类型对应差异化的权限配置和安全策略，形成了分层的权限管控体系：

主会话（main）：代表你本人直接控制的核心会话，通常拥有最高信任级别和最完整的操作权限，可以访问完整工具链并执行高权限操作。适合执行明确授权的个人任务。
私聊会话（dm）：表示来自外部平台的一对一聊天。虽然交互对象是单人，但由于消息来源并非本地直接输入，通常会启用沙箱或额外校验机制，权限相对受限，高权限操作、敏感资源访问必须触发二次身份校验与用户手动授权，以降低误触发高风险操作的可能性。
群组会话（group）：表示多人聊天群，安全限制通常最严格。因为群消息来源复杂、参与者多、上下文容易混杂，所以一般只允许保守操作，默认仅开放只读类、无风险基础工具，严格禁止高权限操作与本地敏感资源访问，防止他人借助群聊指令间接操控你的本地环境或敏感资源。

三、系统架构

1、整体架构：单进程承载，五大子系统协同

OpenClaw 奉行 “单进程，全功能” (Single Process, Full Features) 的极简架构哲学，将整个 AI 网关能力内聚于 一个长时运行的 Node.js 进程 中。也就是说，当你运行 openclaw gateway 时，系统只启动了一个长期运行的 Node.js 进程，由这个单一进程承载和调度整个网关的所有能力，成为整个 OpenClaw 系统的载体。而在进程内部，OpenClaw 按职责划分了五个核心子系统，所有核心功能均由五大子系统协同实现，共同完成从消息接入、上下文维护、智能体执行到外部控制的完整闭环。

五个核心子系统分别是：

Queue （消息队列）
Channel Adapters（渠道适配器）
Session Manager（会话管理器）
Agent Runtime（智能体运行时）
Control Plane（控制平面）

整体架构图：

2、Queue（消息队列）

Queue 是 OpenClaw 的“消息调度中心”，承担了系统内部消息的接收、暂存、串行化与有序分发，是五大子系统之间协同工作的核心纽带。它通过解耦各子系统的消息交互，避免了因处理速度差异、瞬时高并发请求等场景导致的消息丢失、执行乱序等问题，同时通过合理的队列策略，平衡系统处理效率与消息执行顺序。

核心职责：

异步解耦：接收端（接收用户消息）与执行端（模型运行）完全分离，上层快速收消息，不会因模型推理速度慢而阻塞通道。
会话级串行控制：以会话（Session）为单位对消息进行排队，严格维护单会话内的消息执行顺序，保证同一会话内任务按序执行。

作用场景：

假如你在同一个会话内连续发了两条消息：”帮我计算 1+1″ 和 “判断计算结果是否为偶数”，第二条消息依赖于第一条消息的执行结果。此时Queue 会将两条消息排队，确保 AI 先完成第一条计算，再处理第二条判断，避免并行执行引发的上下文冲突、资源竞争与结果异常。

队列策略：

Queue 采用 “分会话管控、分优先级调度” 的队列策略，兼顾消息执行的有序性和系统处理的高效性，具体规则如下：

同一 Session 的消息严格串行处理：同一用户 / 终端的会话（Session）中，所有发送的消息均遵循 “先入先出”（FIFO）原则，按发送顺序依次分发执行。先序消息执行过程中，后序消息会进入等待队列，直至前一条消息完整执行完成，确保同一会话内的指令逻辑连贯、结果有序，避免出现指令执行顺序颠倒导致的业务异常。比如先执行 “关闭文件” 再执行 “编辑文件” 的逻辑错误。
不同 Session 的消息允许并行处理：不同用户 / 终端的独立会话相互隔离，消息可被分配至独立调度单元并行处理，互不阻塞。从而充分利用系统计算资源，提升系统的多用户并发能力。比如用户 A 正在让 AI 撰写长文，完全不会影响用户 B 秒查天气，两者互不影响。

3、Channel Adapters（渠道适配器）

Channel Adapters 是 OpenClaw 架构的“通信桥梁”，负责打通系统内部与各类主流聊天平台的连接通道，屏蔽不同平台的通信协议差异，为上层业务提供统一、标准化的通信接口，大幅降低多平台适配的开发成本和维护难度。

核心职责：

平台认证：负责建立并维护与外部平台的连接与认证，处理复杂的认证流程、鉴权与心跳保活，并自动实现断线重连、异常重试等功能。
消息标准化解析：将来自不同平台不同结构的原始消息数据解析并转换为 OpenClaw 内部通用的标准消息对象，提取核心信息，屏蔽平台格式差异。
访问控制：通过配置的多层次访问控制策略，对入站消息进行过滤，决定是否进入 AI 处理流程，支持白名单、群组权限、关键词过滤等规则，避免无效请求与滥用。
结果格式化：将 AI 生成的统一格式结果，转换为各平台可接收的特定格式，确保消息能够在不同平台正常显示和发送。格式化操作主要包含Markdown兼容处理、超长消息拆分等。

作用场景：

你部署了一个 OpenClaw 助手，名字叫“小助手”，最初只接入微信，后来又想扩展到钉钉和飞书。由于不同平台的鉴权方式、消息格式、事件结构均不相同，若无 Channel Adapters，这些差异就需要在业务层分别处理，代码会越来越重复且难以维护。引入 Channel Adapters 后，只需为各平台实现独立适配器，将外部消息统一转为内部标准结构，上层 Agent 逻辑无需修改即可全平台复用，显著提升扩展效率与可维护性。

4、Session Manager（会话管理器）

Session Manager 是 OpenClaw 架构的“会话控制中心”，负责 Session 的全生命周期管理，确保不同来源、不同场景下的会话彼此隔离、互不污染，是实现多用户/多对话隔离、上下文边界管控和身份映射等功能的核心机制。

核心职责：

会话生命周期管理：负责会话的创建、动态更新、过期判定与自动清理，确保会话资源合理分配，避免无效会话占用系统资源。
会话归属与隔离：基于 Session ID 实现消息的精准路由，确保入站消息准确分配到对应会话，严格保障会话隔离，避免消息串线、上下文污染等问题。同时还会根据会话类型的不同，执行差异化的安全策略，进行精细的权限管控。
会话上下文管理：持久化存储对话历史，后续用户在当前会话中继续对话时，可以快速重建对话上下文、填充历史消息，保障对话连贯性。并且当上下文长度到达阈值时，会自动进行压缩修建，保留核心信息，平衡上下文完整性与资源占用。

作用场景：

公司大群中部署了 OpenClaw 智能助手 “小助手”，并且开启了群内用户独立会话隔离，此时系统就会通过 Session Manager 的会话隔离机制，为群内每一位成员分配独立会话空间。当同事 A 在群内请求查询资料，同事 B 同时请求预约会议室时，Session Manager 会自动识别不同用户身份，创建两个相互独立的会话上下文，确保两位同事的指令、历史对话与任务状态完全隔离，互不干扰。

5、Agent Runtime（智能体运行时）

Agent Runtime 是 OpenClaw 架构的“执行中枢”，本质是 AI 智能体的受控执行环境，负责承载 Agent 的全生命周期运行，覆盖任务理解、组装上下文、调用模型、执行工具、维护记忆等操作，执行完整的”思考-行动-反馈”循环。但要注意的是，系统本身并不具备原生推理能力，而是通过对接外部 LLM（如 GPT、Claude 等），并结合系统技能（Skills）、记忆（Memory）与会话（Session）状态，驱动智能体完成从 “理解意图” 到 “执行任务” 的全流程。

核心职责：

上下文装配: 构建上下文环境，整合会话历史、持久记忆和系统配置等信息，组装结构化 System Prompt（包含智能体身份、规则、可用技能），必要时还会执行上下文压缩与裁剪，避免token溢出。
模型调度与推理：根据任务需求，选择合适的 LLM （支持多模型切换），调用外部大语言模型完成推理。并解析推理结果，判断是直接输出回复还是触发工具调用。
循环执行控制：如果推理结果为工具调用，则调用执行对应工具后，会再将执行结果追加至上下文，重新进入推理循环；若输出最终答案，则终止循环，否则继续进入循环。同时为避免无限死循环，会限制智能体执行的最大循环次数。
任务收尾与资源回收: 任务执行结束后，持久化执行结果，更新会话历史与记忆状态。同时还会回收执行过程中占用的资源，保障系统健康运行。

运行机制：

Agent Runtime 的核心运行机制是 Agent Loop（智能体循环），这是 OpenClaw 最关键的执行逻辑，每次接收用户消息或触发事件后，都会进入该循环，依次完成 “上下文装配→模型推理→工具执行→结果反馈” 的闭环，且支持多轮迭代直至任务完成。

案例场景：

假设你向部署好的 Openclaw 发问”帮我创建一个名为 test.txt 的文件，内容是 Hello World”，大体执行步骤如下：

你的消息  ↓接收消息并进入 Agent Loop  ↓模型推理："需要使用 write_file 工具"  ↓Runtime 执行工具调用，执行 write_file(path="test.txt", content="Hello World")  ↓工具返回结果："文件创建成功"  ↓将结果装配到上下文中，再次进入推理环节  ↓模型基于结果，生成自然语言回复："我已经创建了 test.txt 文件，内容为 Hello World"  ↓返回给你

上下文组装的细节：

上下文组装是 Agent Runtime 执行流程中的核心步骤，主要作用是在每一轮大模型推理前，自动整合所需信息，组装成一个完整、结构化的“提示词上下文”，为 AI 提供全面且清晰的执行依据，尽可能的使模型的推理结果贴合系统规则、用户偏好及当前会话场景。其中主要包含以下信息：

系统指令：来源于 AGENTS.md配置文件，主要用于定义 AI 智能体的基本行为规范、核心约束及功能边界，明确要遵循的底层规则，避免越权或偏离预设定位。
个性化设置：来源于 SOUL.md配置文件，主要用于定义 AI 的个性化设置，包括说话风格、语气语调、应答习惯等，让 AI 输出更具专属感，贴合用户对交互体验的需求。
工具使用指南：来源于 TOOLS.md配置文件，主要用于结合用户自身环境，明确工具的使用偏好、操作规范及注意事项，确保 AI 调用工具时贴合用户实际使用习惯。
可用技能列表：主要用于定义当前环境中可调用的所有 Skills（技能），并附带详细的使用说明、参数要求及适用场景，让 AI 清晰知晓可调用的能力范围。
会话历史记录：主要用于同步当前会话的历史记录，确保 AI 能够衔接上下文，避免重复询问、遗忘前文信息，保障交互的连贯性。
语义记忆检索：从用户过往的所有会话记录中，智能检索出与当前会话相关的关键内容，补充到上下文中，让模型具备长期记忆能力，推理过程也更具针对性和准确性。

6、Control Plane（控制平面）

Control Plane 是 OpenClaw 架构的 “控制中枢”，它并非一个单一功能组件，而是一套包含接入网关、控制协议、状态管理、安全策略与调度逻辑的完整控制平面体系。该体系以 Gateway 为核心，通过 WebSocket 构建统一控制平面，对外提供标准化、多形态的控制接口。目前支持 Web UI（浏览器界面）、CLI（命令行工具）、macOS App（桌面端应用）、Mobile Nodes（移动端节点）四大类控制接口，所有消息指令与交互请求均通过这些接口汇聚至 Gateway，完成接入握手与安全校验后，再进行统一调度、路由分发与状态协同。其设计核心是 “统一接入、集中决策、分布式执行”，让用户可在多终端无缝管理 OpenClaw 的运行状态、会话与配置等。

核心职责：

统一接入与管理： 汇聚多端控制请求，处理客户端与 Gateway 的连接握手、身份认证与权限校验，建立安全可控的控制通道。
系统配置与管理：提供对系统全局配置、节点配置以及 Gateway 服务本身（启动、停止、重启）的集中化管理和动态更新能力。
安全与权限控制：统一管控所有控制操作的权限，基于角色与策略限制客户端的操作范围，实现细粒度访问控制，对敏感操作进行安全审批。
系统状态监控： 实时采集 Gateway、Agent、节点的运行状态、资源占用、健康指标，展示系统健康度。提供系统日志查询、异常告警能力，支持问题快速排查。

1、传统 AI 助手的痛点

2、OpenClaw 的解决方案

3、综合对比

二、关键概念

1、Gateway（网关）

关键特性：

2、Nodes（节点）

常见 Node 类型：

3、Channels（渠道）

4、Skills（技能）

核心价值：

适用场景：

官方规范：

基础模板：

加载优先级：

ClawHub:

5. Session（会话）

Session ID:

会话类型：

三、系统架构

1、整体架构：单进程承载，五大子系统协同

五个核心子系统分别是：

整体架构图：

2、Queue（消息队列）

核心职责：

作用场景：

队列策略：

3、Channel Adapters（渠道适配器）

核心职责：

作用场景：

4、Session Manager（会话管理器）

核心职责：

作用场景：

5、Agent Runtime（智能体运行时）

核心职责：

运行机制：

上下文组装的细节：

6、Control Plane（控制平面）

核心职责：

祝各位同学晋升/涨薪/升学/工作/生活一切顺利~，求个关注，求个赞！！