从 OpenClaw 到 Claude Code:8 个 Agent Harness 的技术架构全拆解-夜雨聆风

从 OpenClaw 到 Claude Code:8 个 Agent Harness 的技术架构全拆解

AI 工程观察

【核心导读】模型只是大脑，真正让它长出手脚、记忆和边界的，是包在外面的那层 harness（智能体外壳）。OpenClaw 因为爆火被中文圈戏称”小龙虾”，但它只是这条赛道的一个切片。本文用一张骨架图 + 一张盘点表，拆清 8 个代表性 harness 的技术架构与分野。

把一个大模型变成能干活的智能体，缺的从来不是脑子，而是一身”壳”。

钳子

先说为什么叫”小龙虾”。

这条赛道最近最火的开源项目叫 OpenClaw——claw 是钳子，中文圈顺手就把它叫成了”小龙虾”。它不是吃的，是一个能装在你电脑上的个人 AI 智能体。

它火到什么程度？2026 年初上线，GitHub 星数几个月冲破 10 万，是当期增长最快的仓库之一，MIT 协议、可自托管。卖点很直白：一个”住在你电脑里的 AI 管家”，扫个二维码就能变成你的 WhatsApp 联系人，帮你收发消息、查资料、跑代码、管日程。

有人评价它”既是一堆垃圾，又是最前沿的艺术品”（hot garbage and state of the art）——意思是它极度可折腾、极度开放，但也极度需要你自己懂行去加护栏。

但 OpenClaw 真正值钱的，不是某个功能，而是它把一件事讲明白了：智能体 = 模型 + 记忆 + 指令 + 触发器 + 工具 + 循环。这套包在模型外面的东西，业界有个统一的名字——harness。

外壳

harness 直译是”马具、挽具”，套在 AI 语境里，就是智能体外壳 / 脚手架。

开源项目 OpenHarness 给了一个被广泛引用的等式：

Harness = 工具 + 知识 + 观察 + 行动 + 权限

说人话：模型负责”智能”，harness 负责给它装上手、眼、记忆和安全边界。没有这层壳，再强的模型也只是个会聊天的盒子；有了它，模型才从”应答机”变成”操作员”。

软件思想家 Martin Fowler 把它画成三个同心圆：最内层是被驯服的模型本身，中间一圈是工具厂商造的”构建者外壳”（builder harness），最外层是你自己搭的”使用者外壳”（user harness，比如你写的 lint 规则、测试钩子、CI 反馈环）。

换句话说，同一个模型，套上不同的壳，就是完全不同的智能体。这也是为什么 8 个产品用着差不多的几个底层大模型，体验却天差地别。

循环

不管哪家的壳，跳动的”心脏”都是同一个——智能体循环（agentic loop），学名 ReAct（Reason + Act，边推理边行动）。

它简单到可以用几行伪代码写完：

while 任务没完成:
    模型读上下文 → 决定下一步
    若要调工具 → 外壳拦截、执行、把结果灌回去
    模型看到结果 → 再决定下一步

关键在第二步：模型并不真的”动手”，它只是用结构化格式喊一句”我要调用 read 读这个文件 / 我要 exec 跑这条命令”。真正去执行、并把结果回灌给模型的，是 harness。 这个”拦截—执行—回灌”的动作，正是智能体和聊天机器人的分水岭。

理解了这个循环，再看下面 8 个产品，你会发现它们拼的不是循环本身，而是循环旁边那一圈零件谁更结实。

八虾

把当下最有代表性的 8 个 harness 摆上桌，大致分两条路线：个人管家型和编码工程型。

名字	阵营 / 出身	定位	架构看点
OpenClaw （小龙虾）	开源 / 社区	个人 AI 管家	本地 gateway + 循环 + 技能 + 持久记忆，TS 实现，10 万星
OpenHarness / ohmo	开源 / HKUDS	轻量通用外壳	Python，复用你的 Claude Code/Codex 订阅，飞书/Slack 里干活
Claude Code	Anthropic	终端编码标杆	Opus 4.7，SWE-bench 87.6%，hooks + 子智能体 + MCP
Codex CLI	OpenAI	终端 / DevOps	GPT-5.5，原生 code mode + 工具搜索，Apache-2.0
Gemini CLI	Google	免费档强	接 Google Cloud，开源，星数仅次于头部
Cursor CLI	Cursor	IDE 起家下沉终端	与 IDE 同一套 harness，主打云端接力（关掉电脑也在跑）
Cline	开源 / 社区	VS Code 扩展	模型无关（BYOK），可换任意大模型，本地运行
OpenHands （前 OpenDevin）	开源	全自动开发环境	CodeAct ：直接写并执行 Python 动作，浏览器+终端+文件全包

补一句生态注脚：连英伟达都下场做了个 NemoClaw，专门给 OpenClaw 智能体提供沙箱化的安全运行环境，从网络、文件到进程级别上锁。一个开源项目能催生出大厂的”配套安保”，本身就说明这赛道有多热。

拆解

把这 8 个壳掀开，你会发现部件高度同构。一个”成熟 harness”通常由这 7 块拼成：

1 工具层（Tools）：一组带类型签名的函数——exec 跑命令、read/write/edit 读写改文件、browser 开浏览器、web_search 搜网。模型只”看得见”通过权限过滤后的那部分工具。

2 技能（Skills）：用 SKILL.md 这类文件，把”某类活该怎么干”的工作流教给智能体。工具是”能力”，技能是”该怎么用能力”。

3 记忆（Memory）：持久化的上下文。OpenClaw 甚至给了个 SOUL.md——你可以编辑智能体的”灵魂”。

4 指令文件（Context files）：CLAUDE.md、AGENTS.md、.cursorrules……每家一套，本质都是”开机自动注入的项目说明书”。

5 权限与沙箱（Permissions）：从只读到全自动分级放权，配 allow/deny 策略和隔离环境。这是把智能体从”玩具”拉向”生产可用”的那道闸。

6 子智能体（Sub-agents）：主智能体把任务拆给多个分身并行处理，再汇总。复杂工程任务的标配。

7 MCP（模型上下文协议）：一套标准化的”工具插座”。不再为每个外部系统硬编码集成，而是让智能体动态发现、按统一格式调用——日历、Notion、自建 API 都能即插即用。

这 7 块的拼法，几乎就是 2026 年所有生产级智能体系统的通用蓝图。

分野

部件相同，路线却分两派。

个人管家型（OpenClaw、ohmo）：追求”无所不能”，一个壳接管你的消息、日程、文件、设备。优点是想象空间大，缺点也很实在——有测评者吐槽它”没有一条明确的成功路径”，更像是给爱折腾的人准备的乐高，而不是创业者想要的”一个能用的按钮”。

编码工程型（Claude Code、Codex、OpenHands 这一挂）：壳收得更紧，工具围着”读代码、改代码、跑测试、提 PR”打转。这一派目前是真正在产业里赚到钱的——SWE-bench、Terminal-Bench 这些硬榜单上，排在前面的几乎全是它们。

行业里慢慢形成一个共识：在真实生产中，”狙击手智能体”往往比”全能管家”更好用。一个干净的提示词、一组受限的工具、一段清晰的边界，胜过一个号称什么都能干的巨型外壳。

隐忧

最后泼盆冷水。harness 真正难的地方，不在”能不能执行”，而在“能不能复现它为什么这么执行”。

当智能体开始在本地模型、工具调用、外部状态之间走多步路径，问题就从 “can it execute?”（它能跑吗）变成了 “can we reconstruct why it executed?”（我们能还原它为什么这么跑吗）。重试时内部状态会不会丢、工具半途失败能不能确定性重放、某个危险动作到底是被硬拦截还是只在运行时过滤了一下——大多数早期智能体栈，恰恰是在这些状态转移的缝隙里悄悄裂开的。

这也是为什么 OpenAI、Stripe 这些团队的内部 harness，越来越像在做”工程基建”：分层架构、自定义 linter、把反馈”左移”、定期”垃圾回收”扫描漂移。他们的原话是：我们现在最难的挑战，已经集中在设计环境、反馈环和控制系统上了。

/ 总结 /

OpenClaw 用一只”小龙虾”把概念讲火，Claude Code 们用硬榜单把它做实，OpenHarness 们用开源把它拆给所有人看。

它们共享同一颗心脏（ReAct 循环）、同一套器官（工具 / 技能 / 记忆 / 权限 / 子智能体 / MCP），区别只在于——壳收得多紧，边界划得多清，状态管得多稳。

模型还在变强，但决定智能体好不好用的，越来越是那层壳。2026 年的护城河，不在”想得多深”，而在”做得多稳”。

参考资料

[1] What Is OpenClaw? A Practical Guide to the Agent Harness Behind the Hype, Zylon Blog, 2026 [2] How OpenClaw Works: Understanding AI Agents Through a Real Architecture, Medium, 2026 [3] OpenHarness (HKUDS) 仓库说明, GitHub, 2026 [4] Harness engineering for coding agent users, Martin Fowler, martinfowler.com, 2026 [5] Top 5 CLI coding agents in 2026, Pinggy Blog, 2026 [6] Best AI Agents for Software Development Ranked, MarkTechPost, 2026年5月15日 [7] awesome-cli-coding-agents, GitHub (bradAGI), 2026

一句话锐评

模型决定智能体能想多深，harness 决定它能做多远。2026 年的竞争，已经从”谁的模型更强”，悄悄挪到了”谁的壳更趁手”。

关注「人工智能AI技术圈」

获取更多 AI 与机器人前沿动态