乐于分享
好东西不私藏

解析 OpenClaw:剥开“龙虾”的外壳(上)

解析 OpenClaw:剥开“龙虾”的外壳(上)

一、简介

        OpenClaw(曾用名 ClawdBot、Moltbot,社区昵称 “龙虾”)是一个适用于全主流操作系统的 AI 智能体网关。它不生产大模型,它只是大模型的搬运工。它以一个中间件的身份,将大模型、主流聊天平台、本地执行环境连接起来,把微信、钉钉等主流聊天平台转化为 AI 的调用入口,简化人与 AI 的协作交互流程。

        用户无需额外安装客户端或访问特定网站,只需通过聊天平台使用自然语言向 AI 发起对话,即可快速获取 AI 响应。并且 OpenClaw 突破了文本交互的约束,支持 AI 根据自然语言指令直接执行本地操作,包括但不限于运行系统命令、操控浏览器、编写与运行代码、管理文件等复杂任务,真正实现 “语言即控制”  的端到端智能体执行能力。看过《钢铁侠》吗?主角托尼・斯塔克有一个超级管家 “贾维斯”,能帮他处理一切事务;而 OpenClaw 就是一个可私有化部署、完全自主可控的开源版 “贾维斯”。无论你身在何处,只要通过已接入的聊天平台下达自然语言指令,它就会自动完成意图解析、任务规划、工具调用、执行落地,并将最终结果原路反馈给你。

        无论是Claude Code、还是龙虾,或者是更早的Manus,本质上都是同一类产品,或者说市场定位类似,都可以归类为通用智能体。虽然这些产品在技术路径和架构设计上各有差异,但本质上要解决的问题却是高度一致。

1、传统 AI 助手的痛点

        在 OpenClaw 这类产品出现之前,传统 AI 助手存在四大核心痛点,严重限制了其实际落地价值:

  • 被困在网页或客户端里:AI 能力被封闭在特定网页或专属客户端中,用户必须打开指定网站、安装专属软件才能使用,无法融入日常工作流,协作流程繁琐。

  • 只能”说”不能”做”:AI 只能进行文本交互、给出方案建议,但不能实际帮你执行任务,比如不能帮你运行命令、修改文件等,需用户手动完成执行。

  • 数据安全风险:用户的对话记录、个人偏好、业务数据等核心信息,均由AI服务提供商集中存储,用户无法自主掌控数据流向与隐私安全。

  • 无法定制和扩展:功能由服务商固定设定,不支持个性化修改与扩展,难以满足不同用户的定制化需求,灵活性不足。

2、OpenClaw 的解决方案

        OpenClaw 以本地部署的 AI 智能体网关为核心,从四个维度针对性解决上述问题:

  • 统一多平台入口:通过一个统一的网关,灵活接入微信、钉钉等主流聊天平台,打破平台壁垒,实现“一处部署、全渠道可用”。

  • 全场景任务执行:突破纯文本交互限制,支持 Shell 命令运行、浏览器自动化控制、文件读写、邮件发送、日程管理等本地的执行能力。

  • 用户数据本地化:全程运行于用户个人电脑或私有服务器,对话记录、个人偏好等用户数据去全部本地存储,从根源上保障隐私安全。

  • 开源和可扩展:基于 MIT 开源协议,支持用户自由修改、二次开发,且通过 Skills 技能系统,可灵活定制、扩展 AI 能力,适配个性化需求。

3、综合对比

二、关键概念

1、Gateway(网关)

        专业解释:Gateway 是 OpenClaw 的核心进程,是一个基于 WebSocket 的服务(默认端口18789),承担着整个系统的核心调度与通信枢纽职责,涵盖消息路由分发、会话生命周期管理、大模型与工具链调用等任务,是连接聊天平台适配器、大模型、本地工具的通信桥梁。

        通俗理解:Gateway 就像是 OpenClaw 的智能接线员!全年无休,24 小时待命,负责接收来自不同渠道(聊天平台)的“需求指令”,然后快速解析识别并精准地分发给对应的“执行部门”(大模型或本地工具)处理,待处理完成后,再将处理结果原路反馈给用户。

关键特性
  • 统一控制节点:一套 OpenClaw 系统只有一个 Gateway,是系统唯一的调度中枢,所有请求与数据交互均需通过 Gateway 统一处理。

  • 后台常驻运行:以系统服务形式在后台静默运行,支持开机自启,可实现 7×24 小时无间断服务。

  • 智能消息路由:可根据消息来源、类型、表示等维度进行分类,将对话消息精准分配至对应的处理模块,并将处理结果返回给对应会话。

  • 持久状态管理:本地持久化存储所有会话的历史记录、用户配置和实时状态等信息,确保多轮对话的上下文连贯性与可追溯性,同时全程数据本地留存,保障数据隐私。

2、Nodes(节点)

        专业解释:Nodes 是 OpenClaw 中通过 WebSocket 长连接(远端节点)或本地进程调用(本地节点)与 Gateway 建立通信、完成注册鉴权的终端设备或服务实例,是 Skill 的实际执行载体,用于向系统提供可调用的特定能力、硬件资源或访问权限(如调用摄像头、访问 GPU、读写本地文件等)。每个 Node 在接入 OpenClaw 之前,都需要通过标准握手流程完成鉴权与能力声明,主动向 Gateway 上报自身设备身份、核心能力清单、权限范围、资源状态等信息。流程通过后纳入系统的统一管理体系,接受 Gateway 下发的任务指令和调度安排,并实时向 Gateway 反馈任务执行状态、资源占用情况。

        通俗理解:想象 Gateway 是中央大脑,Nodes 就是四肢和感官,大脑只负责决策、指令拆解和分配任务,不直接执行任何具体操作;所有需要硬件支持、专属权限、算力支撑的具体执行动作,都由对应的 Node 完成。例如办公电脑是一个桌面节点,能提供 GPU 计算、本地文件管理、桌面应用操控等能力。Gateway 可根据具体任务需求,随时调度一个或多个 Node 协同配合,组合完成复杂的综合任务

常见 Node 类型
  • 本地节点(Local Node):与 Gateway 运行在同一台机器上,是系统默认的执行节点,无需额外配置即可提供本机系统命令运行、文件读写、应用操控等核心能力,是 OpenClaw 开箱即用的基础执行载体;

  • 移动终端节点(iOS/Android手机):提供摄像头、麦克风、定位服务等移动端能力,适配移动场景下的轻量化任务与实时交互需求。

  • 桌面 / 专属系统节点(macOS/Windows电脑):提供系统独有服务(如 macOS iMessage 集成)、桌面应用操控等平台化能力,适配桌面场景下的专业操作与本地资源管理需求。

  • 算力服务节点:提供 GPU 并行计算、AI 本地模型推理、大数据处理、密集型运算等高性能算力资源,适配算力密集型场景。

  • IoT / 边缘设备节点:运行在智能家居、传感器等边缘设备上的轻量节点,可实现物理世界的设备操控、数据采集、自动化控制,拓展了 OpenClaw 的物理世界交互边界。

3、Channels(渠道)

        专业解释:Channels 是 OpenClaw 与外部消息平台之间的协议适配层(Adapter Layer),是实现跨平台消息互通的基础。由于不同的聊天平台使用不同的底层协议,且消息数据结构、接口规范和权限校验逻辑也各不相同,天然存在沟通壁垒。而每个聊天平台都可以通过一个专属的 Channel Adapter,来处理该平台特有的接入流程与通信规则,包括身份认证、事件订阅、消息收发、消息格式转换、媒体上传下载等。通过 Channels 的封装处理,OpenClaw 解决了不同平台间的通信壁垒,为上层业务提供了统一、标准化的交互接口。上层业务无需针对不同平台单独开发适配逻辑,只需基于统一接口开发,即可实现一次开发、全平台适配

        通俗理解:可以把 Channels 想象成一个“全能翻译官”,每个聊天平台就是一个说不同语言的“国家”,“微信国”有自己的语言和语法,“钉钉国”、“f飞书国”也各有一套“说话规则”,他们之间无法直接互通交流。而 Channels 的核心作用就是把这些不同的语言,都翻译成 OpenClaw 能统一理解的通用语言,确保系统能准确理解并正确执行;同时,也会把 OpenClaw 的处理结果,翻译成各个聊天平台能识别的本国语言,确保结果能正确回复和显示。此外,这个“翻译官”还会负责“对接事宜”,比如使用不同的API,验证 OpenClaw 在各个平台的身份、监控平台连接状态、处理消息发送失败的情况等事宜。这样一来,OpenClaw 只需使用一种通用语言即可与所有平台沟通,而底层的协议差异、格式差异、交互差异等,都被 Channels 屏蔽掉了,上层业务模块完全不用关心不同平台的区别。

4、Skills(技能)

        专业解释:Skills 是 OpenClaw 的模块化能力扩展机制,是将提示词工程 (Prompt Engineering) 与工具调用 (Tool Execution) 结合的标准化封装。其核心定位是为通用智能体提供一套标准化的「技能包」封装与调用协议,实现专业知识、工作流程、工具调用逻辑的模块化、可移植、可复用,彻底解决传统 Agent 能力与平台强耦合、难以迁移复用的痛点。

        通俗理解: 想象 Openclaw 是一个极度聪明但刚入职的“资深高T”员工,它懂很多高深专业知识,但还不知道如何操作你公司的内部系统,不知道怎么按当前团队的规范写代码,只能自由发挥,结果自然也就好坏参半。而 Skills 就是给这位员工的操作手册和规范文档,文档中写明了内部系统的操作流程、团队代码规范等信息,让其能够根据手册文档,快速掌握对应的技能,让其按照正确的方向进行发挥,出现好结果的可能性大大提升。

核心价值:

        在没有 Skills 的情况下,大模型往往只能依赖通用理解去“猜”你的意图。而有了 Skills ,就可以把一些具体的经验、流程和规范显式地沉淀下来,让大模型:

  • 知道某类任务应该如何拆解。

  • 知道优先使用哪些工具。

  • 知道输出应该遵循什么格式。

  • 知道有哪些边界、限制和注意事项。

  • 知道怎样更贴近你的业务场景和团队习惯。

        可以理解为:Skill 的价值除了“增加技能”之外,更重要的是让大模型在面对具体任务时,能够以更稳定、更专业、更符合预期的方式工作。

适用场景:
  • 外部工具接入:让大模型学会如何正确使用某个外部系统或接口。

  • 工作流程固化:把团队常见流程沉淀为可复用能力。

  • 领域知识增强:让大模型更懂某个专业领域的术语、规则和步骤。

  • 个性化定制:让大模型更符合个人/组织的使用习惯。

官方规范

        一个标准的 Skill 本质是一个文件夹,唯一强制项为根目录下的 SKILL.md,除此之外,还有诸多可选扩展目录,常见的有:

skill-identifier/          # 目录名=name字段(严格一致)├──SKILL.md               # 必需:元数据+执行指令(核心)├──scripts/               # 可选:可执行脚本(Python/Shell/JS等)├──references/            # 可选:领域文档、API手册、标准规范├──assets/                # 可选:模板、CSV、图片、配置文件等静态资源└──sub-skills/            # 可选:子技能集合(复杂任务拆分)

SKILL.md文件使用 YAML frontmatter + Markdown 指令正文的标准格式编写。其中 YAML frontmatter 用于定义技能的元信息(如技能名称、适用场景、依赖工具等),Markdown 指令正文则详细规定了 AI 如何调用特定工具、执行特定类型的任务。

元信息:

YAML frontmatter 定义的元信息,拥有以下必填字段和常见可选字段:

指令正文:

        Markdown 指令正文是自然语言 SOP(标准作业程序),是对应技能的核心执行逻辑,通常包含以下内容:

  • 使用场景(Usage):明确触发条件与适用边界

  • 分步执行步骤(Steps):逻辑严谨、无歧义、可复现

  • 输入 / 输出(Input/Output):明确参数格式与结果规范

  • 错误处理(Error Handling):异常、边界、失败的处理逻辑

  • 示例(Examples):典型输入输出对(Few-Shot 增强稳定性)

基础模板:
---# 技能元数据(YAML 格式,必须放在最顶部)# 严格遵循 AgentSkills 规范,兼容 OpenClaw / Cursor / Claude Codename: 技能英文标识description: 清晰说明技能功能version: 1.0.0author: 作者名称tags:  - 标签1  - 标签2  - 工具类---# 技能名称## 技能用途本技能的核心目标、解决的问题、提供的能力。## 适用场景什么情况下应该使用本技能(触发条件)。## 不适用场景明确禁止/不推荐使用的场景。## 输入要求需要用户提供哪些信息、参数、格式。## 输出要求输出格式、风格、长度、结构、语言要求。## 执行流程AI 执行本技能的标准步骤(分点说明)。## 工具调用规则调用外部工具、API、命令行时的规则、权限、依赖。## 约束条件边界限制、安全规则、敏感操作、异常处理规则。## 使用示例提供真实可运行的输入 → 输出样例,方便 AI 理解。

具体示例:

---name: getWeatherdescription: 提供国内主要城市的实时气象数据、当日及未来3天短期天气预报,覆盖温度、天气状况、风力风向、湿度等核心信息,适配出行、穿搭、户外活动等生活场景的气象查询需求。version: 1.0.0author: 猪猪侠tags:  - 天气查询  - 生活工具  - 出行参考---# 天气查询技能## 技能用途为用户提供国内主要城市的实时气象数据、当日及未来3天短期天气预报,覆盖温度、天气状况、风力风向、湿度等核心信息。## 适用场景1.用户主动询问指定城市的实时温度、天气状况、风力湿度等基础气象信息2.用户需要出行、通勤、旅游、户外运动等场景的气象参考与配套建议3.用户询问当日及未来3天的短期天气预报,规划近期行程与活动安排4.用户仅提供城市名称,无额外限定条件,默认查询该城市当日实时天气5.用户询问对应天气下的穿衣搭配、出行注意事项等衍生生活需求## 不适用场景1.不提供历史气象数据回溯、未来4天及以上的中长期天气预报服务2.不支持境外非主要城市、国内县级市以下行政区域的精准气象查询3.不提供气象灾害预警、应急避险提示、专业气象科研数据等官方专项服务4.不支持经纬度、IP地址、自动定位的静默查询,仅处理用户主动提供的城市名称查询5.不提供农业、工业、航运、航空等专业领域的行业气象数据与决策建议6.不处理多城市批量天气对比、极端天气概率预测等非标准化查询需求## 输入要求1.必填参数:city_name,数据类型为字符串,格式为国内主要城市的中文全称/简称、全拼/简拼,支持「省+市」层级格式,无默认值2.可选参数:query_date,数据类型为字符串,格式为YYYY-MM-DD,取值范围为「当日至未来3天」,默认为系统当日日期3.若用户输入存在重名城市(如西安市vs西安镇),需先向用户确认精准行政区域,再执行查询## 执行流程1.解析用户自然语言指令,精准识别天气查询意图,提取 city_name、query_date 等核心参数2.若无有效 city_name ,触发标准引导话术,明确提示用户提供目标城市名称;若城市名称存在歧义/重名,向用户确认精准行政区域,获取明确信息后再进入下一步3.调用天气 API 获取实时数据,请求仅携带查询必需的城市参数,设置3s超时阈值,无重复调用、无冗余请求4.对接口返回数据进行合规清洗,仅保留授权范围内的气象指标,校验数据完整性与有效性,剔除异常值与非需求数据5.按照标准输出模板,整理为用户易读的中文文本;若用户有穿搭、出行等衍生需求,配套补充对应基础建议## 工具调用规则1. 优先选用国内具备ICP备案、合规运营的官方气象相关平台公开接口,严禁调用无资质、高风险、无用户协议的第三方接口2. 单用户单次查询仅发起1次接口请求,单日单用户调用次数不超过公开接口的免费频次限制,无恶意刷量、无循环调用行为3. 全流程节点触发异常时,匹配对应场景的标准友好提示,明确告知用户问题原因与解决建议,无空白返回、无报错信息透传## 输出要求### 1. 基础输出模板(实时天气,默认场景)【XX市】实时气象信息▸ 当前温度:XX℃▸ 体感温度:XX℃▸ 天气状况:XX(晴/多云/阴/雨/雪等)▸ 风向风力:XX风 X级▸ 相对湿度:XX%### 2. 扩展输出模板(短期预报/带场景需求)【XX市】20XX-XX-XX 天气预报▸ 天气状况:XX▸ 温度范围:XX℃ ~ XX℃▸ 风向风力:XX风 X级▸ 降水概率:XX%【出行/穿衣建议】XXXXXXXXXX### 3. 格式与内容要求- 统一使用中文简体,表述口语化、无专业晦涩术语,易读易懂- 禁用复杂表格、图片、Markdown高阶格式,仅使用基础换行与项目符号- 单次查询仅返回1个目标城市的结果,不冗余输出非用户请求的内容- 数值类信息保留整数位,无多余小数,单位标注清晰规范,无歧义- 不输出广告、第三方产品推荐、未经证实的气象相关言论,不编造、夸大气象数据- 若用户询问气象预警、灾害相关内容,必须明确提示「相关信息请以国家气象部门官方发布为准」,不替代官方发布专项信息## 约束条件1.严格遵循《中华人民共和国个人信息保护法》,绝不收集、存储、传输、共享用户的地理位置、个人身份等任何隐私信息2.仅执行天气查询相关的合规接口调用,无任何系统命令执行、文件读写、网络越权访问行为3.仅输出授权范围内的气象数据,不篡改、不编造、不隐瞒气象数据异常情况## 使用示例### 示例1:基础实时天气查询- 输入:北京今天天气怎么样?- 输出:【北京市】实时气象信息▸ 当前温度:18℃▸ 体感温度:17℃▸ 天气状况:晴▸ 风向风力:南风 2级▸ 相对湿度:45%### 示例2:带日期的短期预报查询- 输入:深圳后天的天气- 输出:【深圳市】2026-04-23 天气预报▸ 天气状况:多云转小雨▸ 温度范围:22℃ ~ 28℃▸ 风向风力:东风 3级▸ 降水概率:60%【出行建议】后天有降雨,出门请携带雨具,早晚温差略大,建议搭配薄外套。
加载优先级:

        Skill 采用三级优先级机制,当多个 Skill 触发、存在同名或功能冲突时,OpenClaw 会按照优先级从高到低加载,高优先级 Skill 会自动覆盖低优先级的同名 / 冲突 Skill。优先级从高到低排序为:

  • Workspace Skills<workspace>/skills/,最高优先级,面向当前工作区,适合放项目专属、团队专属、任务专属的 Skills。

  • Managed Skills~/.openclaw/skills/,中等优先级,面向当前用户,所有 Agent 可共享,适合放个人常用的 Skills。

  • Bundled Skills:安装包内置,最低优先级,系统自带的基础 Skills,适合作为默认能力和通用模板。

        补充:如果同优先级的两个 Skill 出现功能冲突,OpenClaw 会同时加载这两个 Skill,最终以加载完成更晚的 Skill 生效;二者会相互污染执行上下文,大概率导致执行过程异常。

ClawHub:

        ClawHub 是 OpenClaw 的 Skills 社区注册表,类似于 npm 之于 Node.js。网站地址:https://clawhub.com,可以在其中搜索并安装别人写好的Skills 

常见命令行操作:

# 搜索 Skillnpx clawhub search "youtube"# 安装 Skillnpx clawhub install summarize# 更新所有已安装的 Skillsnpx clawhub update --all# 发布你自己的 Skillnpx clawhub sync --all

5.  Session(会话)

        专业解释:Session 是 OpenClaw 的上下文隔离单元 (Context Isolation Unit),是保障多场景交互隔离、权限精细化管控、运行时安全防护的底层设计。每个 Session 均为独立的上下文隔离单元,都拥有独立的对话历史、工具权限、文件访问边界以及沙箱执行策略等,用来确保不同来源、不同场景、不同信任等级下的交互彼此隔离、上下文互不污染。 

        通俗理解:把 OpenClaw 想象成一栋办公楼,那 Session 就是一个个不同的办公室。每个办公室都有专属 “监控记录”(对话历史,记录在这里发生的所有对话)、专属的 “工作权限”(能使用哪些办公工具、能做哪些操作),还有专属的 “隔音玻璃墙”(沙箱策略,防止其他办公室的信息闯入,也防止自己的信息泄露出去),它们之间互不干扰,相互独立。

Session ID:

        每个 Session 对应全局唯一的 Session ID ,该 ID 采用URN(统一资源名称)结构化命名空间规范,它直接编码了来源、协议和信任边界等关键信息到字符串中,ID 标准格式通常为:[命名空间]:[所属主体]:[来源平台]:[会话类型]:[唯一标识] ,例如:agent:main:whatsapp:dm:+123456789 。

会话类型

        OpenClaw 基于「信任等级 – 来源风险 – 权限范围」三维度,划分了三类核心会话类型,每种类型对应差异化的权限配置和安全策略,形成了分层的权限管控体系:

  • 主会话(main):代表你本人直接控制的核心会话,通常拥有最高信任级别和最完整的操作权限,可以访问完整工具链并执行高权限操作。适合执行明确授权的个人任务。

  • 私聊会话(dm):表示来自外部平台的一对一聊天。虽然交互对象是单人,但由于消息来源并非本地直接输入,通常会启用沙箱或额外校验机制,权限相对受限,高权限操作、敏感资源访问必须触发二次身份校验与用户手动授权,以降低误触发高风险操作的可能性。

  • 群组会话(group):表示多人聊天群,安全限制通常最严格。因为群消息来源复杂、参与者多、上下文容易混杂,所以一般只允许保守操作,默认仅开放只读类、无风险基础工具,严格禁止高权限操作与本地敏感资源访问,防止他人借助群聊指令间接操控你的本地环境或敏感资源。

三、系统架构

1、整体架构:单进程承载,五大子系统协同

        OpenClaw 奉行 “单进程,全功能” (Single Process, Full Features) 的极简架构哲学,将整个 AI 网关能力内聚于 一个长时运行的 Node.js 进程 中。也就是说,当你运行 openclaw gateway 时,系统只启动了一个长期运行的 Node.js 进程,由这个单一进程承载和调度整个网关的所有能力,成为整个 OpenClaw 系统的载体。而在进程内部,OpenClaw 按职责划分了五个核心子系统,所有核心功能均由五大子系统协同实现,共同完成从消息接入、上下文维护、智能体执行到外部控制的完整闭环。

五个核心子系统分别是:
  • Queue (消息队列)

  • Channel Adapters(渠道适配器)

  • Session Manager(会话管理器)

  • Agent Runtime(智能体运行时)

  • Control Plane(控制平面)

整体架构图:
2、Queue(消息队列)

        Queue 是 OpenClaw 的“消息调度中心”,承担了系统内部消息的接收、暂存、串行化与有序分发,是五大子系统之间协同工作的核心纽带。它通过解耦各子系统的消息交互,避免了因处理速度差异、瞬时高并发请求等场景导致的消息丢失、执行乱序等问题,同时通过合理的队列策略,平衡系统处理效率与消息执行顺序。

核心职责
  • 异步解耦:接收端(接收用户消息)与执行端(模型运行)完全分离,上层快速收消息,不会因模型推理速度慢而阻塞通道。

  • 会话级串行控制:以会话(Session)为单位对消息进行排队,严格维护单会话内的消息执行顺序,保证同一会话内任务按序执行。

作用场景

        假如你在同一个会话内连续发了两条消息:”帮我计算 1+1″ 和 “判断计算结果是否为偶数”,第二条消息依赖于第一条消息的执行结果。此时Queue 会将两条消息排队,确保 AI 先完成第一条计算,再处理第二条判断,避免并行执行引发的上下文冲突、资源竞争与结果异常。

队列策略

        Queue 采用 “分会话管控、分优先级调度” 的队列策略,兼顾消息执行的有序性和系统处理的高效性,具体规则如下:

  • 同一 Session 的消息严格串行处理:同一用户 / 终端的会话(Session)中,所有发送的消息均遵循 “先入先出”(FIFO)原则,按发送顺序依次分发执行。先序消息执行过程中,后序消息会进入等待队列,直至前一条消息完整执行完成,确保同一会话内的指令逻辑连贯、结果有序,避免出现指令执行顺序颠倒导致的业务异常。比如先执行 “关闭文件” 再执行 “编辑文件” 的逻辑错误。

  • 不同 Session 的消息允许并行处理:不同用户 / 终端的独立会话相互隔离,消息可被分配至独立调度单元并行处理,互不阻塞。从而充分利用系统计算资源,提升系统的多用户并发能力。比如用户 A 正在让 AI 撰写长文,完全不会影响用户 B 秒查天气,两者互不影响。

3、Channel Adapters(渠道适配器)

        Channel Adapters 是 OpenClaw 架构的“通信桥梁”,负责打通系统内部与各类主流聊天平台的连接通道,屏蔽不同平台的通信协议差异,为上层业务提供统一、标准化的通信接口,大幅降低多平台适配的开发成本和维护难度。

核心职责
  • 平台认证:负责建立并维护与外部平台的连接与认证,处理复杂的认证流程、鉴权与心跳保活,并自动实现断线重连、异常重试等功能。

  • 消息标准化解析:将来自不同平台不同结构的原始消息数据解析并转换为 OpenClaw 内部通用的标准消息对象,提取核心信息,屏蔽平台格式差异。

  • 访问控制:通过配置的多层次访问控制策略,对入站消息进行过滤,决定是否进入 AI 处理流程,支持白名单、群组权限、关键词过滤等规则,避免无效请求与滥用。

  • 结果格式化:将 AI 生成的统一格式结果,转换为各平台可接收的特定格式,确保消息能够在不同平台正常显示和发送。格式化操作主要包含Markdown兼容处理、超长消息拆分等。

作用场景

        你部署了一个 OpenClaw 助手,名字叫“小助手”,最初只接入微信,后来又想扩展到钉钉和飞书。由于不同平台的鉴权方式、消息格式、事件结构均不相同,若无 Channel Adapters,这些差异就需要在业务层分别处理,代码会越来越重复且难以维护。引入 Channel Adapters 后,只需为各平台实现独立适配器,将外部消息统一转为内部标准结构,上层 Agent 逻辑无需修改即可全平台复用,显著提升扩展效率与可维护性。

4、Session Manager(会话管理器)

        Session Manager 是 OpenClaw 架构的“会话控制中心负责 Session 的全生命周期管理,确保不同来源、不同场景下的会话彼此隔离、互不污染,是实现多用户/多对话隔离、上下文边界管控和身份映射等功能的核心机制。 

核心职责:
  • 会话生命周期管理:负责会话的创建、动态更新、过期判定与自动清理,确保会话资源合理分配,避免无效会话占用系统资源。

  • 会话归属与隔离:基于 Session ID 实现消息的精准路由,确保入站消息准确分配到对应会话,严格保障会话隔离,避免消息串线、上下文污染等问题。同时还会根据会话类型的不同,执行差异化的安全策略,进行精细的权限管控。

  • 会话上下文管理:持久化存储对话历史,后续用户在当前会话中继续对话时,可以快速重建对话上下文、填充历史消息,保障对话连贯性。并且当上下文长度到达阈值时,会自动进行压缩修建,保留核心信息,平衡上下文完整性与资源占用。

作用场景:

        公司大群中部署了 OpenClaw 智能助手 “小助手”,并且开启了群内用户独立会话隔离,此时系统就会通过 Session Manager 的会话隔离机制,为群内每一位成员分配独立会话空间。当同事 A 在群内请求查询资料,同事 B 同时请求预约会议室时,Session Manager 会自动识别不同用户身份,创建两个相互独立的会话上下文,确保两位同事的指令、历史对话与任务状态完全隔离,互不干扰。

5、Agent Runtime(智能体运行时)

        Agent Runtime 是 OpenClaw 架构的“执行中枢”,本质是 AI 智能体的受控执行环境,负责承载 Agent 的全生命周期运行,覆盖任务理解、组装上下文、调用模型、执行工具、维护记忆等操作,执行完整的”思考-行动-反馈”循环。但要注意的是, 系统本身并不具备原生推理能力,而是通过对接外部 LLM(如 GPT、Claude 等),并结合系统技能(Skills)、记忆(Memory)与会话(Session)状态,驱动智能体完成从 “理解意图” 到 “执行任务” 的全流程。

核心职责:
  • 上下文装配: 构建上下文环境,整合会话历史、持久记忆和系统配置等信息,组装结构化 System Prompt(包含智能体身份、规则、可用技能),必要时还会执行上下文压缩与裁剪,避免token溢出。

  • 模型调度与推理:根据任务需求,选择合适的 LLM (支持多模型切换),调用外部大语言模型完成推理。并解析推理结果,判断是直接输出回复还是触发工具调用。

  • 循环执行控制:如果推理结果为工具调用,则调用执行对应工具后,会再将执行结果追加至上下文,重新进入推理循环;若输出最终答案,则终止循环,否则继续进入循环。同时为避免无限死循环,会限制智能体执行的最大循环次数。

  • 任务收尾与资源回收:  任务执行结束后,持久化执行结果,更新会话历史与记忆状态。同时还会回收执行过程中占用的资源,保障系统健康运行。

运行机制:

        Agent Runtime 的核心运行机制是 Agent Loop(智能体循环),这是 OpenClaw 最关键的执行逻辑,每次接收用户消息或触发事件后,都会进入该循环,依次完成 “上下文装配→模型推理→工具执行→结果反馈” 的闭环,且支持多轮迭代直至任务完成。

案例场景:

        假设你向部署好的 Openclaw 发问”帮我创建一个名为 test.txt 的文件,内容是 Hello World”,大体执行步骤如下:

你的消息  ↓接收消息并进入 Agent Loop  ↓模型推理:"需要使用 write_file 工具"  ↓Runtime 执行工具调用,执行 write_file(path="test.txt", content="Hello World")  ↓工具返回结果:"文件创建成功"  ↓将结果装配到上下文中,再次进入推理环节  ↓模型基于结果,生成自然语言回复:"我已经创建了 test.txt 文件,内容为 Hello World"  ↓返回给你
上下文组装的细节

        上下文组装是 Agent Runtime 执行流程中的核心步骤,主要作用是在每一轮大模型推理前,自动整合所需信息,组装成一个完整、结构化的“提示词上下文”,为 AI 提供全面且清晰的执行依据,尽可能的使模型的推理结果贴合系统规则、用户偏好及当前会话场景。其中主要包含以下信息:

  • 系统指令:来源于 AGENTS.md配置文件,主要用于定义 AI 智能体的基本行为规范、核心约束及功能边界,明确要遵循的底层规则,避免越权或偏离预设定位。

  • 个性化设置:来源于 SOUL.md配置文件,主要用于定义 AI 的个性化设置,包括说话风格、语气语调、应答习惯等,让 AI 输出更具专属感,贴合用户对交互体验的需求。

  • 工具使用指南:来源于 TOOLS.md配置文件,主要用于结合用户自身环境,明确工具的使用偏好、操作规范及注意事项,确保 AI 调用工具时贴合用户实际使用习惯。

  • 可用技能列表:主要用于定义当前环境中可调用的所有 Skills(技能),并附带详细的使用说明、参数要求及适用场景,让 AI 清晰知晓可调用的能力范围。

  • 会话历史记录:主要用于同步当前会话的历史记录,确保 AI 能够衔接上下文,避免重复询问、遗忘前文信息,保障交互的连贯性。

  • 语义记忆检索:从用户过往的所有会话记录中,智能检索出与当前会话相关的关键内容,补充到上下文中,让模型具备长期记忆能力,推理过程也更具针对性和准确性。

6、Control Plane(控制平面)

        Control Plane 是 OpenClaw 架构的 “控制中枢”,它并非一个单一功能组件,而是一套包含接入网关、控制协议、状态管理、安全策略与调度逻辑的完整控制平面体系。该体系以 Gateway 为核心,通过 WebSocket 构建统一控制平面,对外提供标准化、多形态的控制接口。目前支持 Web UI(浏览器界面)、CLI(命令行工具)、macOS App(桌面端应用)、Mobile Nodes(移动端节点) 四大类控制接口,所有消息指令与交互请求均通过这些接口汇聚至 Gateway,完成接入握手与安全校验后,再进行统一调度、路由分发与状态协同。其设计核心是 “统一接入、集中决策、分布式执行”,让用户可在多终端无缝管理 OpenClaw 的运行状态、会话与配置等。

核心职责:
  • 统一接入与管理: 汇聚多端控制请求,处理客户端与 Gateway 的连接握手、身份认证与权限校验,建立安全可控的控制通道。

  • 系统配置与管理:提供对系统全局配置、节点配置以及 Gateway 服务本身(启动、停止、重启)的集中化管理和动态更新能力。

  • 安全与权限控制:统一管控所有控制操作的权限,基于角色与策略限制客户端的操作范围,实现细粒度访问控制,对敏感操作进行安全审批。

  • 系统状态监控: 实时采集 Gateway、Agent、节点的运行状态、资源占用、健康指标,展示系统健康度。提供系统日志查询、异常告警能力,支持问题快速排查。


    祝各位同学晋升/涨薪/升学/工作/生活一切顺利~,求个关注,求个赞!!