OpenClaw架构解析:一个本地AI Agent如何真正执行任务

❝
OpenClaw是一个开源的个人 AI 助手项目，由知名开发者Peter Steinberger发起，目标是在用户自有设备上运行真正能做事的AI——不仅能对话，还能操作文件、执行命令和自动完成任务。项目采用本地优先、隐私可控的设计理念，让数据始终掌握在用户手中。开源协议为MIT License，完全免费，支持商用与二次开发。核心理念：将大模型智能与本地代理控制权分离，使AI具备能力的同时，用户仍拥有完整的数据与自动化控制权。一句话理解：OpenClaw是一个面向实际执行任务的本地AI自动化平台。

核心功能

本地运行，数据不离开设备
支持 WhatsApp、Telegram、Slack 等多平台接入
Skills 插件机制，方便扩展能力
支持多模型自由切换（Claude / GPT / 开源模型）
后台长期运行，7×24 小时响应任务

工作原理：一条指令的真实旅程

假设你通过飞书对 OpenClaw 说：帮我整理今天下载文件夹里的所有 PDF，分类后生成一个知识索引页面。OpenClaw会经历以下步骤：

接收与标准化：飞书适配器接收消息，转换为统一内部消息格式，记录用户身份与会话上下文。
路由与排队（Lane Queue）：Gateway将任务放入该Session的串行队列，同一用户的任务永远按顺序执行。这避免了 Agent 系统常见的问题：文件冲突、状态混乱、并发失控。
Agent 推理阶段：Agent Runner 被唤醒，它动态构建上下文，SOUL.md（行为风格）、TOOLS.md（可用工具）、AGENTS.md（角色定义）、历史记忆，随后调用大模型进行规划，模型可能生成计划：1. 扫描 PDF、2. 提取标题与主题、3. 自动分类、4. 生成索引网页。（注意：模型只负责决策，不直接执行。）
Skills 工具执行：系统依次调用 Skills，文件扫描工具、PDF解析工具、分类算法、HTML生成器，每一步都有明确日志。
循环反馈：Agent 根据执行结果持续调整计划，分类失败 → 重试策略、文件异常 → 跳过并记录，进度通过 WebSocket 实时回传。用户看到的是：AI 正在“工作”，而不是一次性回答。
持久化与可追溯：所有行为被保存为 .json（指令、决策、工具调用、输出结果），这意味着 AI的行为第一次可以被完整审计。

这个过程的核心是可靠性和可控性：所有操作都在你的设备上串行执行，避免了并发混乱；所有数据都留在本地，保障隐私。

整体架构：分层解耦，职责清晰

LLM（大脑）
        ↓
OpenClaw（Agent Runtime）
        ↓
API / Device / Software

关键组件功能详解

Gateway网关（核心枢纽）

定位：系统的大脑与通信中枢

核心功能：

协议编排：统一处理来自 CLI、Telegram、Web 等渠道的消息并标准化。
会话管理：为每个「用户 × 渠道」维护独立 Session 状态。
指令队列：采用 Lane-based 队列机制，确保指令有序、可靠执行。
实时流反馈：通过 WebSocket 低延迟推送执行进度（打字状态、工具调用等）。

Agent Runner（智能体运行器）

定位：AI 能力的执行引擎

核心功能：

动态提示词构建：基于 SOUL.md、TOOLS.md、AGENTS.md 与会话历史实时生成完整 Prompt。
模型调用与容错：支持多模型调度（OpenAI、Anthropic、本地模型），失败自动降级或切换 Key。
上下文管理：监控上下文长度，自动触发总结压缩或安全终止。

Channel Adapters（通道适配器）

定位：外部渠道的协议翻译层

核心功能：

消息归一化：将不同平台消息转换为统一内部数据结构。
附件处理：自动下载、缓存图片、音频、PDF 等文件供工具调用。

记忆系统（Memory System）

定位：Agent 的长期记忆与个性基础

核心功能（四层架构）：

SOUL：不可变的核心价值与行为规则。
TOOLS：可调用工具的元数据定义。
USER：基于向量库的用户长期记忆（偏好与习惯）。
Session：当前对话的短期上下文记忆。

Skills（技能插件）

定位：Agent 的可扩展能力模块

核心功能：

能力扩展：通过安装 SKILL.md 即可新增系统能力（如 Apple Notes 操作）。
自主调用： Agent 依据 SKILL.md 的调用契约自动构造 API 请求，无需模型再训练。

普通Agent

LLM → API → LLM → API
（并发混乱）

OpenClaw真正的架构意义

Session
   ↓
Lane Queue（串行）
   ↓
Skill 调用

它天然可以成为：企业AI中台执行层、Robot OS上层调度。

❝
AI 的下一阶段，不是更大的模型，而是更完整的系统。