乐于分享
好东西不私藏

从 OpenClaw 到 Claude Code:8 个 Agent Harness 的技术架构全拆解

从 OpenClaw 到 Claude Code:8 个 Agent Harness 的技术架构全拆解

AI 工程观察

【核心导读】模型只是大脑,真正让它长出手脚、记忆和边界的,是包在外面的那层 harness(智能体外壳)。OpenClaw 因为爆火被中文圈戏称”小龙虾”,但它只是这条赛道的一个切片。本文用一张骨架图 + 一张盘点表,拆清 8 个代表性 harness 的技术架构与分野。

把一个大模型变成能干活的智能体,缺的从来不是脑子,而是一身”壳”。

钳子

先说为什么叫”小龙虾”。

这条赛道最近最火的开源项目叫 OpenClaw——claw 是钳子,中文圈顺手就把它叫成了”小龙虾”。它不是吃的,是一个能装在你电脑上的个人 AI 智能体。

它火到什么程度?2026 年初上线,GitHub 星数几个月冲破 10 万,是当期增长最快的仓库之一,MIT 协议、可自托管。卖点很直白:一个”住在你电脑里的 AI 管家”,扫个二维码就能变成你的 WhatsApp 联系人,帮你收发消息、查资料、跑代码、管日程。

有人评价它”既是一堆垃圾,又是最前沿的艺术品”(hot garbage and state of the art)——意思是它极度可折腾、极度开放,但也极度需要你自己懂行去加护栏。

但 OpenClaw 真正值钱的,不是某个功能,而是它把一件事讲明白了:智能体 = 模型 + 记忆 + 指令 + 触发器 + 工具 + 循环。这套包在模型外面的东西,业界有个统一的名字——harness

外壳

harness 直译是”马具、挽具”,套在 AI 语境里,就是智能体外壳 / 脚手架

开源项目 OpenHarness 给了一个被广泛引用的等式:

Harness = 工具 + 知识 + 观察 + 行动 + 权限

说人话:模型负责”智能”,harness 负责给它装上手、眼、记忆和安全边界。没有这层壳,再强的模型也只是个会聊天的盒子;有了它,模型才从”应答机”变成”操作员”。

软件思想家 Martin Fowler 把它画成三个同心圆:最内层是被驯服的模型本身,中间一圈是工具厂商造的”构建者外壳”(builder harness),最外层是你自己搭的”使用者外壳”(user harness,比如你写的 lint 规则、测试钩子、CI 反馈环)。

换句话说,同一个模型,套上不同的壳,就是完全不同的智能体。这也是为什么 8 个产品用着差不多的几个底层大模型,体验却天差地别。

循环

不管哪家的壳,跳动的”心脏”都是同一个——智能体循环(agentic loop),学名 ReAct(Reason + Act,边推理边行动)。

它简单到可以用几行伪代码写完:

while 任务没完成:
    模型读上下文 → 决定下一步
    若要调工具 → 外壳拦截、执行、把结果灌回去
    模型看到结果 → 再决定下一步

关键在第二步:模型并不真的”动手”,它只是用结构化格式喊一句”我要调用 read 读这个文件 / 我要 exec 跑这条命令”。真正去执行、并把结果回灌给模型的,是 harness。 这个”拦截—执行—回灌”的动作,正是智能体和聊天机器人的分水岭。

理解了这个循环,再看下面 8 个产品,你会发现它们拼的不是循环本身,而是循环旁边那一圈零件谁更结实。

八虾

把当下最有代表性的 8 个 harness 摆上桌,大致分两条路线:个人管家型编码工程型

名字
阵营 / 出身
定位
架构看点
OpenClaw

(小龙虾)
开源 / 社区
个人 AI 管家
本地 gateway + 循环 + 技能 + 持久记忆,TS 实现,10 万星
OpenHarness / ohmo
开源 / HKUDS
轻量通用外壳
Python,复用你的 Claude Code/Codex 订阅,飞书/Slack 里干活
Claude Code
Anthropic
终端编码标杆
Opus 4.7,SWE-bench 87.6%,hooks + 子智能体 + MCP
Codex CLI
OpenAI
终端 / DevOps
GPT-5.5,原生 code mode + 工具搜索,Apache-2.0
Gemini CLI
Google
免费档强
接 Google Cloud,开源,星数仅次于头部
Cursor CLI
Cursor
IDE 起家下沉终端
与 IDE 同一套 harness,主打云端接力(关掉电脑也在跑)
Cline
开源 / 社区
VS Code 扩展
模型无关(BYOK),可换任意大模型,本地运行
OpenHands

(前 OpenDevin)
开源
全自动开发环境
CodeAct

:直接写并执行 Python 动作,浏览器+终端+文件全包

补一句生态注脚:连英伟达都下场做了个 NemoClaw,专门给 OpenClaw 智能体提供沙箱化的安全运行环境,从网络、文件到进程级别上锁。一个开源项目能催生出大厂的”配套安保”,本身就说明这赛道有多热。

拆解

把这 8 个壳掀开,你会发现部件高度同构。一个”成熟 harness”通常由这 7 块拼成:

1 工具层(Tools):一组带类型签名的函数——exec 跑命令、read/write/edit 读写改文件、browser 开浏览器、web_search 搜网。模型只”看得见”通过权限过滤后的那部分工具。

2 技能(Skills):用 SKILL.md 这类文件,把”某类活该怎么干”的工作流教给智能体。工具是”能力”,技能是”该怎么用能力”。

3 记忆(Memory):持久化的上下文。OpenClaw 甚至给了个 SOUL.md——你可以编辑智能体的”灵魂”。

4 指令文件(Context files)CLAUDE.mdAGENTS.md.cursorrules……每家一套,本质都是”开机自动注入的项目说明书”。

5 权限与沙箱(Permissions):从只读到全自动分级放权,配 allow/deny 策略和隔离环境。这是把智能体从”玩具”拉向”生产可用”的那道闸。

6 子智能体(Sub-agents):主智能体把任务拆给多个分身并行处理,再汇总。复杂工程任务的标配。

7 MCP(模型上下文协议):一套标准化的”工具插座”。不再为每个外部系统硬编码集成,而是让智能体动态发现、按统一格式调用——日历、Notion、自建 API 都能即插即用。

这 7 块的拼法,几乎就是 2026 年所有生产级智能体系统的通用蓝图。

分野

部件相同,路线却分两派。

个人管家型(OpenClaw、ohmo):追求”无所不能”,一个壳接管你的消息、日程、文件、设备。优点是想象空间大,缺点也很实在——有测评者吐槽它”没有一条明确的成功路径”,更像是给爱折腾的人准备的乐高,而不是创业者想要的”一个能用的按钮”。

编码工程型(Claude Code、Codex、OpenHands 这一挂):壳收得更紧,工具围着”读代码、改代码、跑测试、提 PR”打转。这一派目前是真正在产业里赚到钱的——SWE-bench、Terminal-Bench 这些硬榜单上,排在前面的几乎全是它们。

行业里慢慢形成一个共识:在真实生产中,”狙击手智能体”往往比”全能管家”更好用。一个干净的提示词、一组受限的工具、一段清晰的边界,胜过一个号称什么都能干的巨型外壳。

隐忧

最后泼盆冷水。harness 真正难的地方,不在”能不能执行”,而在“能不能复现它为什么这么执行”

当智能体开始在本地模型、工具调用、外部状态之间走多步路径,问题就从 “can it execute?”(它能跑吗)变成了 “can we reconstruct why it executed?”(我们能还原它为什么这么跑吗)。重试时内部状态会不会丢、工具半途失败能不能确定性重放、某个危险动作到底是被硬拦截还是只在运行时过滤了一下——大多数早期智能体栈,恰恰是在这些状态转移的缝隙里悄悄裂开的。

这也是为什么 OpenAI、Stripe 这些团队的内部 harness,越来越像在做”工程基建”:分层架构、自定义 linter、把反馈”左移”、定期”垃圾回收”扫描漂移。他们的原话是:我们现在最难的挑战,已经集中在设计环境、反馈环和控制系统上了。

/ 总结 /

OpenClaw 用一只”小龙虾”把概念讲火,Claude Code 们用硬榜单把它做实,OpenHarness 们用开源把它拆给所有人看。

它们共享同一颗心脏(ReAct 循环)、同一套器官(工具 / 技能 / 记忆 / 权限 / 子智能体 / MCP),区别只在于——壳收得多紧,边界划得多清,状态管得多稳。

模型还在变强,但决定智能体好不好用的,越来越是那层壳。2026 年的护城河,不在”想得多深”,而在”做得多稳”。

参考资料

[1] What Is OpenClaw? A Practical Guide to the Agent Harness Behind the Hype, Zylon Blog, 2026 [2] How OpenClaw Works: Understanding AI Agents Through a Real Architecture, Medium, 2026 [3] OpenHarness (HKUDS) 仓库说明, GitHub, 2026 [4] Harness engineering for coding agent users, Martin Fowler, martinfowler.com, 2026 [5] Top 5 CLI coding agents in 2026, Pinggy Blog, 2026 [6] Best AI Agents for Software Development Ranked, MarkTechPost, 2026年5月15日 [7] awesome-cli-coding-agents, GitHub (bradAGI), 2026

一句话锐评

模型决定智能体能多深,harness 决定它能多远。2026 年的竞争,已经从”谁的模型更强”,悄悄挪到了”谁的壳更趁手”。

关注「人工智能AI技术圈」

获取更多 AI 与机器人前沿动态