OpenClaw 源码解析系列·第2篇:Agent 引擎——消息循环与状态管理-夜雨聆风

OpenClaw 源码解析系列·第2篇:Agent 引擎——消息循环与状态管理

一、从一条消息说起

当用户在微信公众号里发来一条消息，这条消息经历怎样的旅程，最终变成一条有意义的回复？

答案是：Agent 引擎——OpenClaw 架构的心脏。它负责接收消息、理解意图、调用 Skill、生成回复、管理状态……全部在这一层完成。

二、消息循环的六个步骤

OpenClaw 的消息循环遵循经典的 ReAct（Reasoning + Acting）模式，整个循环分为六个阶段：

🔄 Agent 消息处理循环

下图展示了消息在各个模块之间的流动路径：

▲ Agent 消息处理循环：消息进入 → 上下文构建 → LLM 推理 → 技能调度 → 结果聚合 → 回复发送

Session 是 OpenClaw 状态管理的核心抽象。每个用户（每个 OpenID）在每个渠道下，对应一个独立的 Session。

Session 在生命周期中会在多个状态之间转换：

▲ Session 状态机：Active（正常处理）→ Paused（等待人类回复）→ Closed（会话结束）

为什么 Session 要设计成可序列化的？ ① 断点恢复：当 Agent 处理长任务时意外中断，可以从最近的 checkpoint 恢复 ② 分叉调试：复制一份 Session，就能开一个新分支做并行实验 ③ 调试友好：Session dump 出来，可以直接在代码里重放，定位 bug

当 messages 列表越来越长，OpenClaw 会触发上下文压缩：

来看核心循环的简化版逻辑：

LLM 只负责决定「做什么」，执行是确定性代码完成的。decision.json 输出后，框架通过 switch 语句路由到对应的工具函数：数据库查询、HTTP 请求、文件读写——全部是确定性操作，不依赖 LLM。这种设计让系统行为可预测、可测试。

当 LLM 判断需要人类介入时（如高风险操作），循环会暂停，等待人类通过外部渠道回复后，再注入 Session 继续循环。

OpenClaw 支持在同一进程内运行多个 Agent 实例，调度逻辑由 Router 完成：

▲ 多 Agent 调度：Router 根据标签/意图将请求分发到对应 Agent 实例

🧭 OpenClaw Router 调度策略

Factor 04：工具就是结构化输出LLM 输出 JSON → switch 路由 → 确定性执行。OpenClaw 完整实现了这一原则。

Factor 05：统一执行状态与业务状态Session 是唯一的真实来源，既是执行状态容器，也是业务状态容器。

Factor 06：简单 API 启动/暂停/恢复pauseSession / resumeSession 是 OpenClaw 内置能力，原生支持。

Factor 12：把 Agent 写成无状态 ReducerAgent 循环是纯函数式逻辑，给定相同的事件序列，总是产生相同的状态变化。

这一篇深入了 Agent 引擎的核心设计：

预告：第3篇《Skills 系统：框架的扩展机制》，深入解析 Skill 接口、生命周期管理、以及内置 Skills 的实现。