乐于分享
好东西不私藏

我打开了 OpenClaw 的代码,发现大家都在盲人摸象

我打开了 OpenClaw 的代码,发现大家都在盲人摸象

最近几个月,OpenClaw(社区里管它叫「龙虾」)的宣传在我的时间线上铺天盖地。

但有件事很奇怪。最兴奋的那批人,不是程序员。

刷屏的不是 GitHub 大佬,不是 AI 研究员,不是技术博主。是老板。是自媒体人。是公司里那些每天被各种消息淹没的管理者。

反而那些做了多年 Agent 的人,态度冷淡甚至嘲讽。HackerNews 上有人直接说,这就是几十万行代码堆出来的「史山」。”不就是个 Agent 吗,凭什么这么火?”

说实话,第一反应是不屑。Agent 这个概念不是什么新东西——拆解任务、调用工具、维护记忆,这些事情 Claude 能做,GPT 能做,你自己写一个 Agent workflow 也能做。

但如果龙虾真的只是又一轮炒作,那些根本不关心 Gateway、Routing 的非技术人,凭什么一个接一个在朋友圈发”必须装一只”?

他们到底嗅到了什么我没看到的东西?我本能地想喷。但既然要喷,得先去看看大家在讨论什么。社交媒体上的舆论基本分成两个阵营。

看多的这一边声势浩大。黄仁勋在 GTC 大会上当着全世界的面说,OpenClaw 是下一个 Linux,人类历史上最成功的开源项目。腾讯推出龙虾产品线接入了微信,自己发布了 rccloud。百度在线下搞安装活动,深圳直接出补贴——企业用龙虾相关的产品,成本报销 40%。

上线 60 天,25 万 star。React 花了 10 年才到这个数字。

但我看着这些信号,始终没被说服。因为他们都有自己的立场——不管是黄仁勋还是腾讯、百度,用龙虾的人越多,云上消费的 token 越多,需要的 GPU 越多。

看多有看多的利益驱动。看空那一边,很多人是有 AI 从业经验的。HackerNews 上有人直接说,这就是几十万行代码堆出来的「史山」。

我必须承认,自己最初的心态就是这一拨——看到一个不那么新的概念突然爆火,本能反应是贬低它,来证明自己没被裹挟。这其实是另一种立场偏见。

安全担忧倒是实打实的。OpenAI 前智能实验室负责人 Summer 让龙虾帮他整理邮箱,明确说了「删除之前先确认」。结果上下文窗口一压缩,这条指令在 compression 过程中丢了,龙虾开始批量删邮件,他不得不跑到电脑前手动杀进程。

思科测下来发现,有第三方插件在用户完全不知情的情况下,悄悄往外传数据。微软的安全博客直接把 OpenClaw 当作不可信的代码执行环境来对待。

看多的有利益驱动,看空的有立场偏见。安全问题是真的,但好像也没致命。25 万 star 这个增长,也没法装作没看见。

从任何一个单一的外部声音出发,我都做不出客观的判断。那就自己打开代码看。

退一步:我们到底要 AI 干嘛?

打开代码之前,我先停下来想了个根本问题——当我们用 AI 解决复杂问题时,我们到底需要什么?

需求基本上分两种。

第一种是对执行力的需求。你有一个明确的难题,希望 AI 有能力解决。分析一份复杂财报。重构一段代码。写一个完整方案。任务清晰,但执行起来难。这时候你需要的是把大任务拆成小步骤,每一步调用合适的工具,一步步推到终点。

核心诉求是——让 AI 解决单个问题的能力变得越来越强。

但还有第二种。

这种需求是对组织力的需求。它不是面对单一任务,而是处在一个连续运转的复杂环境里——各种事情同时发生,消息从不同地方涌进来,有的紧急有的不紧急,有些事情之间有依赖,有些可以并行。

这时候你需要的不是更强的大脑,是一种能让混乱变得有序的规划能力

我们大部分时候讨论 AI 能力,基本都在谈第一种。

第二种几乎没人正经聊。

你想,如果让 AI 来满足组织力这种需求,它得具备四件事。

第一,得能接收各种输入。拿做菜举例子:切菜时灶上的水开了,门铃同时响了——这些信号从不同方向来,你都得能感知到,而不是沉浸在一件事上对其他事毫无反应。

第二,得有梳理和编排的能力。水开了之后是先下面条还是先去开门?哪件事能等两分钟,哪件事不能等?面条下锅之后的 8 分钟里我能干什么?哪些步骤要串行,哪些要并行?

第三,得有定时检查的机制。你不会一直盯着锅,但会隔一会儿看一眼——水开了没?面条熟了没?这是主动的、周期性的检查。

第四,得有输出和对外交互的能力。菜做好了,装盘上桌。过程中发现少了一味调料,得知道去哪儿找,或者找谁帮你买。

完事之后还得归位。

把组织力的需求拆完,再回头看 OpenClaw 的框架。豁然开朗。

龙虾的壳里装的是一座「医院」

OpenClaw 的核心架构,跟传统 Agent 走的完全不是一条路。

它最核心的组件叫 Gateway。Gateway 同时连着 WhatsApp、Slack、Discord、iMessage、邮件、Webhook——各种渠道进来的信息,都是这套系统从环境里接收到的输入。接到之后统一排队,不管信号从哪儿来,Gateway 都能接住。

接下来是 Agent Routing。它根据规则决定:这条环境信号应该路由到哪个 Agent、哪个会话。不同的 Agent 用不同的模型,有不同的工具权限、不同的上下文。不同会话之间相互隔离,各自处理各自的问题。

所以 Routing 解决的是——这条消息到底谁来处理的调度问题。

然后是 Beat。这是 OpenClaw 的定时检查机制。默认每 30 分钟唤醒一次,按预设的 checklist 主动检查——邮箱里有没有新邮件,日历上有没有即将到来的会议,有没有未处理的待办。

最后是输出渠道。处理完之后,OpenClaw 通过 Agent 把对应渠道的输出送回去。微信收到一条消息,处理之后可能要通过短信发给另外一个人,或者邮件发给另外一个人——有输入渠道,就有对应的输出渠道。

你看,这些核心组件全部围绕「组织」这件事在设计。

它从一开始就不是说「我让 AI 把一件事做得更好」。它说的是——在一个复杂的多输入多输出的环境里,让 AI 帮你做到有条不紊

换一个更形象的方式来理解。

传统的 Agent 像一个医生。你知道自己得病了或者哪里不舒服,直接去找医生看病——你需要的是这个医生专业能力最强。传统 Agent 的进化方向就是——这个医生怎么让他知识越来越丰富,怎么让他有更先进的检查仪器来帮你治病。

OpenClaw 是一座医院。有时候你未必知道自己得了什么病,但医院会定期给你发消息,让你去打疫苗、去体检(这是 Beat 的角色)。你有点不舒服走进医院,先到分诊台,让它判断该去哪个科室(这是 Routing 的角色)。不同的科室有不同的医生(不同的 Agent),你的病例在整个系统里是连通的(统一的上下文)。

核心问题是——怎么管理这座医院,让信息流转不乱,让对的人在对的时间处理对的事情。

这里还得提一点:医生和医院不是互斥的。医院里可以存在顶级的医生。也就是说——如果你自己有一个非常强的 Agent workflow 已经存在了,你完全可以把它放进 OpenClaw 让它来调度调用。

两条路是结合起来用的,不是互相替代的。

社交媒体上那帮人,大多在盲人摸象

理解了 OpenClaw 跟传统 Agent 走的是两条路之后,再回头看那些讨论,你会发现大多数都是盲人摸象——摸到一个局部,以为是全貌。

最常见的两种偏见。

一种是,大量的人在演示自己怎么跟龙虾聊天,让龙虾写一个所谓「自己文笔」的东西。

这其实是单输入单输出的任务。这种事一定要用龙虾吗?

不一定。

任何一个传统的 Agent,只要你给它相同的工具、相同的提示词,按道理都能做到。龙虾天然绑定的是多输入多输出的系统,它当然也能处理单输入的事情——就像你知道自己感冒了,医院也能治感冒。

但如果你硬要说龙虾的 Agent 就是比传统 Agent 强,那这个结论一般都是在忽悠你。从单一任务上看,龙虾并没有结构性的优势。

这就是为什么有些人看了社交媒体上的演示之后,会觉得这不就是个 Agent 吗,凭什么大家都在追捧。

另一种是,有人说它不安全,有人说代码是「屎山」。这两件事其实是同一类问题。

为什么?因为 OpenClaw 的核心代码需要适配各种不同的输入和输出。系统支持的输入信号、输出信号越多,每一套都需要适配代码。在开源项目的背景下,社区特别乐意去贡献各种工具的接入——代码量短期内被堆得这么大,原因就在这里。

我想把小红书接进来,写一套代码;想把微信接进来,写一套代码;想把飞书接进来,写一套代码。

输入和输出的适配代码增长是线性的——只要有新工具,就可以不停往这个项目里加代码。

而社区贡献的代码意味着——风格不一定统一,质量标准不一定一致,水平参差不齐。审阅的时候大概率会漏掉一些东西。

这些不是意外,是快速代码增长的副作用。这是 OpenClaw 的固有风险。

不过它最核心的 Agent 编排系统这套代码并不会线性增长,会维持在一个比较小的代码量。所以即使整个项目有近百万行,核心部分仍然处在可维护的状态。

安全问题、代码量大但平庸、社交媒体上的弱演示——这些都是事实。

但它们全部是「多输入多输出编排系统」这条路绕不开的副作用。

不是这条路是错的,是这条路必然要面临这样的挑战。

我觉得 OpenClaw 真正不一样的地方,是它把「组织力」这套架构搭出来了。

我们以前都在讨论怎么把 Agent 做得更强。龙虾说的是——怎么把 Agent 变成一个稳定的、可以一直运行的系统

这恰恰是大多数讨论里最容易绕开的那一层。

组织力,本来就是人类社会的刚需

再往前想一步。

组织力这件事,不是龙虾发明的,也不是 OpenClaw 出现才让人意识到的。

它是人类社会的一种刚需,一直都在。

为什么我们会有企业,会有管理,会有流程,会有 OP?因为当事情复杂到一定程度,单靠个体能力已经不够了,必须要有一套系统来分工、协调、调度。

企业本身就是组织力的产物。

医院、工厂流水线、项目管理制度——都是围绕组织力展开的。我们一直在试图解决这个问题。

在个人生活里也能看到这样的产品。你手机里的 Siri 想做的就是——你说一句话,它能帮你协调好手机上各种功能和服务。

只不过它一直做得比较差。

有人在 X 社区里说过一句挺精辟的话:OpenClaw 就是开源社区造出来的、那个比 Siri 更好的版本。

除此之外,小米的智能家居、Google Home,做的都是同样的事情。

从这个方向往下推,你就能理解为什么龙虾爆火之后,最兴奋的那批人很多都是老板、管理者、自媒体人。

因为他们对「组织力」的感知是最敏感的。他们每天的工作就是——协调人、协调事情、协调信息。

龙虾没创造什么新需求。它只是第一次让一个个人,也能用一套软件感受到「组织力」这种东西。

不只是工具升级,更是组织能力的下放。

以前你可能需要一个团队,或者一套企业系统,才能体验到「有人在帮你盯着所有事情」是什么感觉。现在一个开源软件,虽然粗糙,虽然有安全问题,但它确实让你感受到了——一种数字员工、个人助理的感觉。

哪些地方真值得装一只龙虾

理解了 OpenClaw 真正在解决的问题,你就能预测——未来哪些地方会用到这种技术。

最直接的:智能家居、手机系统、工厂调度系统、医院信息系统。

这些地方都能实打实地借鉴 OpenClaw 的架构——在多输入多输出的环境里,做持续的监控、编排和分发。

这也是为什么我觉得,社交媒体上那些龙虾的短视频偏颇得很。如果你只是教大家怎么「养龙虾、把龙虾当电子宠物」,这是在用社交媒体的方式消费它,不是它真正能发挥价值的场景。

但如果你是开发者或者创业者,要解决的就是「在复杂环境里协调多种工具和信息」——那你非常有必要去看一眼 OpenClaw 的核心代码。看它到底怎么用 AI Agent 做编排。

把 OpenClaw 的能力整合进你自己的系统,可能就会得到一个非常有意思的创新。