❝OpenClaw是一个开源的个人 AI 助手项目,由知名开发者Peter Steinberger发起,目标是在用户自有设备上运行真正能做事的AI——不仅能对话,还能操作文件、执行命令和自动完成任务。 项目采用本地优先、隐私可控的设计理念,让数据始终掌握在用户手中。 开源协议为MIT License,完全免费,支持商用与二次开发。 核心理念:将大模型智能与本地代理控制权分离,使AI具备能力的同时,用户仍拥有完整的数据与自动化控制权。 一句话理解:OpenClaw是一个面向实际执行任务的本地AI自动化平台。
核心功能
本地运行,数据不离开设备 支持 WhatsApp、Telegram、Slack 等多平台接入 Skills 插件机制,方便扩展能力 支持多模型自由切换(Claude / GPT / 开源模型) 后台长期运行,7×24 小时响应任务
工作原理:一条指令的真实旅程
假设你通过飞书对 OpenClaw 说:帮我整理今天下载文件夹里的所有 PDF,分类后生成一个知识索引页面。OpenClaw会经历以下步骤:
接收与标准化:飞书适配器接收消息,转换为统一内部消息格式,记录用户身份与会话上下文。 路由与排队(Lane Queue):Gateway将任务放入该Session的串行队列,同一用户的任务永远按顺序执行。这避免了 Agent 系统常见的问题:文件冲突、状态混乱、并发失控。 Agent 推理阶段:Agent Runner 被唤醒,它动态构建上下文,SOUL.md(行为风格)、TOOLS.md(可用工具)、AGENTS.md(角色定义)、历史记忆,随后调用大模型进行规划,模型可能生成计划:1. 扫描 PDF、2. 提取标题与主题、3. 自动分类、4. 生成索引网页。(注意:模型只负责决策,不直接执行。) Skills 工具执行:系统依次调用 Skills,文件扫描工具、PDF解析工具、分类算法、HTML生成器,每一步都有明确日志。 循环反馈:Agent 根据执行结果持续调整计划,分类失败 → 重试策略、文件异常 → 跳过并记录,进度通过 WebSocket 实时回传。用户看到的是:AI 正在“工作”,而不是一次性回答。 持久化与可追溯:所有行为被保存为 .json(指令、决策、工具调用、输出结果),这意味着 AI的行为第一次可以被完整审计。
这个过程的核心是 可靠性 和 可控性:所有操作都在你的设备上串行执行,避免了并发混乱;所有数据都留在本地,保障隐私。
整体架构:分层解耦,职责清晰
LLM(大脑)
↓
OpenClaw(Agent Runtime)
↓
API / Device / Software

关键组件功能详解

Gateway网关(核心枢纽)
定位:系统的大脑与通信中枢
核心功能:
协议编排: 统一处理来自 CLI、Telegram、Web 等渠道的消息并标准化。 会话管理: 为每个「用户 × 渠道」维护独立 Session 状态。 指令队列: 采用 Lane-based 队列机制,确保指令有序、可靠执行。 实时流反馈: 通过 WebSocket 低延迟推送执行进度(打字状态、工具调用等)。
Agent Runner(智能体运行器)
定位:AI 能力的执行引擎
核心功能:
动态提示词构建: 基于 SOUL.md、TOOLS.md、AGENTS.md 与会话历史实时生成完整 Prompt。 模型调用与容错: 支持多模型调度(OpenAI、Anthropic、本地模型),失败自动降级或切换 Key。 上下文管理: 监控上下文长度,自动触发总结压缩或安全终止。
Channel Adapters(通道适配器)
定位:外部渠道的协议翻译层
核心功能:
消息归一化:将不同平台消息转换为统一内部数据结构。 附件处理:自动下载、缓存图片、音频、PDF 等文件供工具调用。
记忆系统(Memory System)
定位:Agent 的长期记忆与个性基础
核心功能(四层架构):
SOUL: 不可变的核心价值与行为规则。 TOOLS: 可调用工具的元数据定义。 USER: 基于向量库的用户长期记忆(偏好与习惯)。 Session: 当前对话的短期上下文记忆。
Skills(技能插件)
定位:Agent 的可扩展能力模块
核心功能:
能力扩展: 通过安装 SKILL.md 即可新增系统能力(如 Apple Notes 操作)。 自主调用: Agent 依据 SKILL.md 的调用契约自动构造 API 请求,无需模型再训练。
普通Agent
LLM → API → LLM → API
(并发混乱)
OpenClaw真正的架构意义
Session
↓
Lane Queue(串行)
↓
Skill 调用
它天然可以成为:企业AI中台执行层、Robot OS上层调度。
❝AI 的下一阶段,不是更大的模型,而是更完整的系统。
夜雨聆风