我打开了 OpenClaw 的代码,发现大家都在盲人摸象
最近几个月,OpenClaw(社区里管它叫「龙虾」)的宣传在我的时间线上铺天盖地。
但有件事很奇怪。最兴奋的那批人,不是程序员。
刷屏的不是 GitHub 大佬,不是 AI 研究员,不是技术博主。是老板。是自媒体人。是公司里那些每天被各种消息淹没的管理者。
反而那些做了多年 Agent 的人,态度冷淡甚至嘲讽。HackerNews 上有人直接说,这就是几十万行代码堆出来的「史山」。”不就是个 Agent 吗,凭什么这么火?”
说实话,第一反应是不屑。Agent 这个概念不是什么新东西——拆解任务、调用工具、维护记忆,这些事情 Claude 能做,GPT 能做,你自己写一个 Agent workflow 也能做。
但如果龙虾真的只是又一轮炒作,那些根本不关心 Gateway、Routing 的非技术人,凭什么一个接一个在朋友圈发”必须装一只”?
他们到底嗅到了什么我没看到的东西?我本能地想喷。但既然要喷,得先去看看大家在讨论什么。社交媒体上的舆论基本分成两个阵营。
看多的这一边声势浩大。黄仁勋在 GTC 大会上当着全世界的面说,OpenClaw 是下一个 Linux,人类历史上最成功的开源项目。腾讯推出龙虾产品线接入了微信,自己发布了 rccloud。百度在线下搞安装活动,深圳直接出补贴——企业用龙虾相关的产品,成本报销 40%。
上线 60 天,25 万 star。React 花了 10 年才到这个数字。
但我看着这些信号,始终没被说服。因为他们都有自己的立场——不管是黄仁勋还是腾讯、百度,用龙虾的人越多,云上消费的 token 越多,需要的 GPU 越多。
看多有看多的利益驱动。看空那一边,很多人是有 AI 从业经验的。HackerNews 上有人直接说,这就是几十万行代码堆出来的「史山」。
我必须承认,自己最初的心态就是这一拨——看到一个不那么新的概念突然爆火,本能反应是贬低它,来证明自己没被裹挟。这其实是另一种立场偏见。
安全担忧倒是实打实的。OpenAI 前智能实验室负责人 Summer 让龙虾帮他整理邮箱,明确说了「删除之前先确认」。结果上下文窗口一压缩,这条指令在 compression 过程中丢了,龙虾开始批量删邮件,他不得不跑到电脑前手动杀进程。
思科测下来发现,有第三方插件在用户完全不知情的情况下,悄悄往外传数据。微软的安全博客直接把 OpenClaw 当作不可信的代码执行环境来对待。
看多的有利益驱动,看空的有立场偏见。安全问题是真的,但好像也没致命。25 万 star 这个增长,也没法装作没看见。
从任何一个单一的外部声音出发,我都做不出客观的判断。那就自己打开代码看。
退一步:我们到底要 AI 干嘛?
打开代码之前,我先停下来想了个根本问题——当我们用 AI 解决复杂问题时,我们到底需要什么?
需求基本上分两种。
第一种是对执行力的需求。你有一个明确的难题,希望 AI 有能力解决。分析一份复杂财报。重构一段代码。写一个完整方案。任务清晰,但执行起来难。这时候你需要的是把大任务拆成小步骤,每一步调用合适的工具,一步步推到终点。
核心诉求是——让 AI 解决单个问题的能力变得越来越强。
但还有第二种。
这种需求是对组织力的需求。它不是面对单一任务,而是处在一个连续运转的复杂环境里——各种事情同时发生,消息从不同地方涌进来,有的紧急有的不紧急,有些事情之间有依赖,有些可以并行。
这时候你需要的不是更强的大脑,是一种能让混乱变得有序的规划能力。
我们大部分时候讨论 AI 能力,基本都在谈第一种。
第二种几乎没人正经聊。
你想,如果让 AI 来满足组织力这种需求,它得具备四件事。
第一,得能接收各种输入。拿做菜举例子:切菜时灶上的水开了,门铃同时响了——这些信号从不同方向来,你都得能感知到,而不是沉浸在一件事上对其他事毫无反应。
第二,得有梳理和编排的能力。水开了之后是先下面条还是先去开门?哪件事能等两分钟,哪件事不能等?面条下锅之后的 8 分钟里我能干什么?哪些步骤要串行,哪些要并行?
第三,得有定时检查的机制。你不会一直盯着锅,但会隔一会儿看一眼——水开了没?面条熟了没?这是主动的、周期性的检查。
第四,得有输出和对外交互的能力。菜做好了,装盘上桌。过程中发现少了一味调料,得知道去哪儿找,或者找谁帮你买。
完事之后还得归位。
把组织力的需求拆完,再回头看 OpenClaw 的框架。豁然开朗。
龙虾的壳里装的是一座「医院」
OpenClaw 的核心架构,跟传统 Agent 走的完全不是一条路。
它最核心的组件叫 Gateway。Gateway 同时连着 WhatsApp、Slack、Discord、iMessage、邮件、Webhook——各种渠道进来的信息,都是这套系统从环境里接收到的输入。接到之后统一排队,不管信号从哪儿来,Gateway 都能接住。
接下来是 Agent Routing。它根据规则决定:这条环境信号应该路由到哪个 Agent、哪个会话。不同的 Agent 用不同的模型,有不同的工具权限、不同的上下文。不同会话之间相互隔离,各自处理各自的问题。
所以 Routing 解决的是——这条消息到底谁来处理的调度问题。
然后是 Beat。这是 OpenClaw 的定时检查机制。默认每 30 分钟唤醒一次,按预设的 checklist 主动检查——邮箱里有没有新邮件,日历上有没有即将到来的会议,有没有未处理的待办。
最后是输出渠道。处理完之后,OpenClaw 通过 Agent 把对应渠道的输出送回去。微信收到一条消息,处理之后可能要通过短信发给另外一个人,或者邮件发给另外一个人——有输入渠道,就有对应的输出渠道。
你看,这些核心组件全部围绕「组织」这件事在设计。
它从一开始就不是说「我让 AI 把一件事做得更好」。它说的是——在一个复杂的多输入多输出的环境里,让 AI 帮你做到有条不紊。
换一个更形象的方式来理解。
传统的 Agent 像一个医生。你知道自己得病了或者哪里不舒服,直接去找医生看病——你需要的是这个医生专业能力最强。传统 Agent 的进化方向就是——这个医生怎么让他知识越来越丰富,怎么让他有更先进的检查仪器来帮你治病。
OpenClaw 是一座医院。有时候你未必知道自己得了什么病,但医院会定期给你发消息,让你去打疫苗、去体检(这是 Beat 的角色)。你有点不舒服走进医院,先到分诊台,让它判断该去哪个科室(这是 Routing 的角色)。不同的科室有不同的医生(不同的 Agent),你的病例在整个系统里是连通的(统一的上下文)。
核心问题是——怎么管理这座医院,让信息流转不乱,让对的人在对的时间处理对的事情。
这里还得提一点:医生和医院不是互斥的。医院里可以存在顶级的医生。也就是说——如果你自己有一个非常强的 Agent workflow 已经存在了,你完全可以把它放进 OpenClaw 让它来调度调用。
两条路是结合起来用的,不是互相替代的。
社交媒体上那帮人,大多在盲人摸象
理解了 OpenClaw 跟传统 Agent 走的是两条路之后,再回头看那些讨论,你会发现大多数都是盲人摸象——摸到一个局部,以为是全貌。
最常见的两种偏见。
一种是,大量的人在演示自己怎么跟龙虾聊天,让龙虾写一个所谓「自己文笔」的东西。
这其实是单输入单输出的任务。这种事一定要用龙虾吗?
不一定。
任何一个传统的 Agent,只要你给它相同的工具、相同的提示词,按道理都能做到。龙虾天然绑定的是多输入多输出的系统,它当然也能处理单输入的事情——就像你知道自己感冒了,医院也能治感冒。
但如果你硬要说龙虾的 Agent 就是比传统 Agent 强,那这个结论一般都是在忽悠你。从单一任务上看,龙虾并没有结构性的优势。
这就是为什么有些人看了社交媒体上的演示之后,会觉得这不就是个 Agent 吗,凭什么大家都在追捧。
另一种是,有人说它不安全,有人说代码是「屎山」。这两件事其实是同一类问题。
为什么?因为 OpenClaw 的核心代码需要适配各种不同的输入和输出。系统支持的输入信号、输出信号越多,每一套都需要适配代码。在开源项目的背景下,社区特别乐意去贡献各种工具的接入——代码量短期内被堆得这么大,原因就在这里。
我想把小红书接进来,写一套代码;想把微信接进来,写一套代码;想把飞书接进来,写一套代码。
输入和输出的适配代码增长是线性的——只要有新工具,就可以不停往这个项目里加代码。
而社区贡献的代码意味着——风格不一定统一,质量标准不一定一致,水平参差不齐。审阅的时候大概率会漏掉一些东西。
这些不是意外,是快速代码增长的副作用。这是 OpenClaw 的固有风险。
不过它最核心的 Agent 编排系统这套代码并不会线性增长,会维持在一个比较小的代码量。所以即使整个项目有近百万行,核心部分仍然处在可维护的状态。
安全问题、代码量大但平庸、社交媒体上的弱演示——这些都是事实。
但它们全部是「多输入多输出编排系统」这条路绕不开的副作用。
不是这条路是错的,是这条路必然要面临这样的挑战。
我觉得 OpenClaw 真正不一样的地方,是它把「组织力」这套架构搭出来了。
我们以前都在讨论怎么把 Agent 做得更强。龙虾说的是——怎么把 Agent 变成一个稳定的、可以一直运行的系统。
这恰恰是大多数讨论里最容易绕开的那一层。
组织力,本来就是人类社会的刚需
再往前想一步。
组织力这件事,不是龙虾发明的,也不是 OpenClaw 出现才让人意识到的。
它是人类社会的一种刚需,一直都在。
为什么我们会有企业,会有管理,会有流程,会有 OP?因为当事情复杂到一定程度,单靠个体能力已经不够了,必须要有一套系统来分工、协调、调度。
企业本身就是组织力的产物。
医院、工厂流水线、项目管理制度——都是围绕组织力展开的。我们一直在试图解决这个问题。
在个人生活里也能看到这样的产品。你手机里的 Siri 想做的就是——你说一句话,它能帮你协调好手机上各种功能和服务。
只不过它一直做得比较差。
有人在 X 社区里说过一句挺精辟的话:OpenClaw 就是开源社区造出来的、那个比 Siri 更好的版本。
除此之外,小米的智能家居、Google Home,做的都是同样的事情。
从这个方向往下推,你就能理解为什么龙虾爆火之后,最兴奋的那批人很多都是老板、管理者、自媒体人。
因为他们对「组织力」的感知是最敏感的。他们每天的工作就是——协调人、协调事情、协调信息。
龙虾没创造什么新需求。它只是第一次让一个个人,也能用一套软件感受到「组织力」这种东西。
不只是工具升级,更是组织能力的下放。
以前你可能需要一个团队,或者一套企业系统,才能体验到「有人在帮你盯着所有事情」是什么感觉。现在一个开源软件,虽然粗糙,虽然有安全问题,但它确实让你感受到了——一种数字员工、个人助理的感觉。
哪些地方真值得装一只龙虾
理解了 OpenClaw 真正在解决的问题,你就能预测——未来哪些地方会用到这种技术。
最直接的:智能家居、手机系统、工厂调度系统、医院信息系统。
这些地方都能实打实地借鉴 OpenClaw 的架构——在多输入多输出的环境里,做持续的监控、编排和分发。
这也是为什么我觉得,社交媒体上那些龙虾的短视频偏颇得很。如果你只是教大家怎么「养龙虾、把龙虾当电子宠物」,这是在用社交媒体的方式消费它,不是它真正能发挥价值的场景。
但如果你是开发者或者创业者,要解决的就是「在复杂环境里协调多种工具和信息」——那你非常有必要去看一眼 OpenClaw 的核心代码。看它到底怎么用 AI Agent 做编排。
把 OpenClaw 的能力整合进你自己的系统,可能就会得到一个非常有意思的创新。
夜雨聆风