乐于分享
好东西不私藏

Open Claw ,小龙虾的前世今生

Open Claw ,小龙虾的前世今生

如果网上疯传的小龙虾🦞,你还以为是一种动物,那就大大落伍了。春节后,最火的是什么,一定是Open Claw。下面我们就来会会这只著名的龙虾。

Open Claw 可以理解为一种 个人助理型智能体运行系统Personal Agent Runtime)。它并不是简单的聊天机器人,而是一个以大语言模型(LLM)为核心决策引擎、在一定的规则(Skills)指导下,能够调用工具并连接外部系统的 智能体平台。从系统结构上看,Open Claw 采用了一种典型的 分层架构。整体系统可以自上而下划分为四个层次:交互层、平台层、能力层和基础运行层。

OpenClaw 不是公司产品,而是一个开源个人项目。它由奥地利开发者 Peter Steinberger 创建,Steinberger 是 PSPDFKit 的创始人。该软件前身是他开发的 AI 虚拟助手 Clawd,最终更名为 OpenClaw。 目前 Steinberger 已加入 OpenAI

一、初步理解Open Claw

(一)一个“会做事”的数字助理

如果把当前主流的 AI 工具做一个简单分类,其实可以分成两类:

1:两类不同能力的 AI

前者的代表,是我们熟悉的大语言模型——它们能够回答问题、生成文本、进行推理,甚至在某些场景下表现出接近人类的理解能力。但无论能力多强,本质上仍然停留在一个阶段:回答问题。

而后者,则正在成为新的方向。用户不再只是问:这个问题的答案是什么?而是开始提出:帮我完成一件事情。例如: 帮我整理今天的 AI 新闻并生成摘要, 帮我查找数据并写一份分析报告, 帮我监控某个信息源并定期提醒。在这些场景中,单纯的“回答”已经不够,AI 必须具备另一种能力:行动能力。Open Claw,正是在这样的背景下出现的一类系统。

(二)把 Open Claw 看成一个“电子秘书”

如果直接从技术角度解释 Open Claw,很容易让人陷入术语之中。因此,我们不妨先换一种方式理解:把 Open Claw 看成一个个人数字秘书。这个秘书并不是一个简单的聊天机器人,而是一个能够思考、决策并执行任务的系统。为了理解它的工作方式,我们可以把它拆解成几个“角色”。

  1. 大脑:LLM

在这个系统中,大语言模型(LLM)相当于秘书的大脑。它负责: 理解用户的需求、 分析问题、 推导解决方案、 生成语言表达。

例如,当你说:帮我整理今天关于人工智能的新闻。LLM 会首先做出判断: 需要搜索信息、 需要筛选来源、 需要进行总结。也就是说,它解决的是:应该做什么。

  1. 神经中枢+调度系统:Agent Runtime

但一个优秀的秘书,仅有“会思考的大脑”是不够的。还需要有一套机制来决定: 先做什么、 后做什么、 在什么条件下执行、 调用哪些工具。这套机制,在 Open Claw 中被称为:Agent Runtime(智能体运行系统/时)。如果说 LLM 是“大脑”,那么 Agent Runtime 就是“神经中枢 调度系统”。

它包含几个关键能力:任务规划(Planner):把复杂任务拆解成步骤、 上下文记忆(Memory):结合当前与历史信息进行判断、 工具路由(Tool Routing):选择合适的执行方式、 通道适配(Channel Adapter):将结果输出到不同平台。它决定这个数字秘书如何行动。

2:小龙虾的傍身技能

3.手和脚:Tools

思考和决策之后,接下来必须真正去“做事”。这就需要 ToolsTools 可以理解为秘书的“手和脚”,负责执行具体动作,例如:浏览网页、 搜索信息、发送消息、 读取 PDF、 执行定时任务。

  1. 工作流程手册:Skills

但在真实世界中,一个专业秘书不仅仅依赖“能力”,还会遵循一套工作规范。例如: 做报告时应先查资料,再整理结构, 重要信息必须优先参考权威来源, 输出需要符合既定格式。在 Open Claw 中,这部分就是:SkillsSkills 并不直接提供新的能力,而是定义: 在什么条件下触发任务, 完成任务需要遵循哪些步骤, 每一步如何调用工具, 输出需要满足什么规范。

Skills 的本质是:该怎么做,把模糊的任务,转化为结构化的工作流程。

  1. 外部设备:Plugins

一个秘书在工作中,往往还会借助外部工具,例如: SPSS 进行数据分析、 Word 生成文档、 PowerPoint 制作演示、 各类系统 API(如接入财务数据、GitHub下载应用)。在 Open Claw 中,这些能力通过 Plugins(插件) 接入。插件的作用,是让智能体可以连接外部系统,从而突破自身能力边界。

  1. 前台与调度:Gateway

有一个容易被忽略的角色:Gateway(网关),它就像办公室的前台或调度中心,负责: 接收用户请求、 进行权限校验、 将任务分发给对应的智能体。它并不参与“思考”,但决定了系统的入口与流转秩序。

3: Open Claw 的拟人化理解

(三)为什么叫“小龙虾”?

“Open Claw”中的 Claw,本意是“爪子”。

在国内开发者社区中,它被形象地称为:小龙虾。这个名字其实并不只是玩笑。从结构上看,智能体真正与现实世界发生交互的,不是“大脑”,而是“执行能力”——也就是那些工具调用机制。这些能力,就像一只小龙虾的钳子: 能抓取信息、 能搬运数据、能操作系统。也正是这些“钳子”,让 AI 从一个“会说话的模型”,变成一个“可以做事的系统”。

但如果要真正理解它的能力边界与设计逻辑,仅靠类比还不够。从工程角度来看,这个“数字秘书”其实是一个分层的系统结构。

二、Open Claw 运行原理分析

从工程角度看,这种结构类似于一个“智能体操作环境”:用户通过各种通信渠道进入系统,平台层负责协调和调度智能体,智能体以 LLM 为核心进行分析与决策,并通过能力层调用各种工具或插件完成真实任务。在这个过程中,通过 skills形成的规则和触发条件,让上面的行为合理有序。

     下面我们按照图4:Open Claw 个人智能体系统架构 中的结构,对其运行机制逐层展开。

4:Open Claw 个人智能体系统架构

(一)交互层:人与智能体的接口

系统的最上层是 交互层(Interaction Layer)。这一层并不承担智能决策,而是负责 人与系统之间的信息交换。在实际部署中,Open Claw 可以接入多种常见的通信渠道,例如:WhatsApp、 Telegram、 Slack、 Discord、 微信等即时通信平台。这些平台在系统中被抽象为 Channel(通道)。用户发送的每一条消息,都会通过这些通道进入 Open Claw 系统。

从系统架构角度看,这一层的角色与互联网系统中的 接口层(Interface Layer)非常类似。它解决的是一个非常基础的问题:用户如何进入系统并与智能体交互。

(二)平台层:系统调度与运行环境

交互层之下,是 Open Claw 的 平台层(Platform Layer)。这一层的核心组件是 Gateway(网关)。Gateway 在系统中承担两种角色:1. 消息网关(Message Gateway)。2. 控制平面(Control Plane

作为消息网关,它负责接收来自不同通信渠道的消息,并将这些消息统一转换为系统内部的标准格式。作为控制平面,它负责: 管理智能体实例、 维护系统会话(Session)、 调度任务、 返回处理结果。

当用户发送一条消息时,Gateway 会首先创建或恢复一个 Session(会话)。Session 可以理解为一个 对话上下文容器,其中保存着:、历史对话记录、 任务状态、 工具调用结果。随后,Gateway 会将当前会话中的问题转交给 Agent(智能体)进行处理。

(三)智能体层:LLM 驱动的决策系统

Open Claw 的核心,是系统中的 Agent(智能体)。在结构上,Agent 并不是单一模块,而是一组协同工作的组件,其核心是 大语言模型(LLM)。LLM 在智能体中的角色,可以理解为 决策引擎(Reasoning Engine)。当用户请求进入系统时,LLM 会对问题进行语义理解、任务分解和策略生成。

围绕 LLM,智能体内部通常还包含几个关键组件:

Planner(任务规划器): 负责将复杂任务拆解为一系列可执行步骤。

Memory(上下文记忆): 用于保存对话历史和任务状态,使智能体具有连续对话能力。

Routing(路由机制): 决定当前任务需要调用哪些工具或能力模块。

Channel Adapter(通道适配): 用于将结果返回给用户所在的平台。

在这一过程中,LLM 并不会直接执行现实操作,而是完成三个关键步骤:

1. 分析(Reasoning

2. 选择能力(Tool Selection

3. 生成结果(Generation

换句话说,智能体负责 思考和决策,而真正执行操作的,是下一层的能力系统。

(四)能力层:智能体行动的基础

在 Open Claw 中,智能体的行动能力来源于 能力层(Capability Layer)。这一层包含三类不同的能力模块: 内置工具(Tools)、 技能规则(Skills)、 扩展插件(Plugins)。它们分别解决不同的问题。

  1. Tools:执行真实操作 

Tools 是系统中最直接的执行能力,例如: 浏览网页、 搜索互联网、 发送消息、 读取 PDF 文件、 定时任务(cron)。这些工具可以理解为 智能体的基本操作能力。当 LLM 决定执行某项任务时,会通过系统调用这些工具完成实际操作。

  1. Skills:智能体的行为规则

如果说 Tools 决定了 智能体能做什么,那么 Skills 决定的是 智能体应该如何去做。Skills 通常以 `SKILL.md` 文件的形式存在,其中描述的是: 技能说明、 行为规则、 触发条件、 工具使用方法。从本质上看,Skills 更像是一种 AI 工作流程规范(AI Workflow)。它为 LLM 提供了一种结构化的操作指南,使智能体能够按照特定逻辑完成任务。

Tools 相当于角色自带的技能,可以执行具体动作, Skills 则像技能的使用规则或战术组合, Plugins 则类似于外挂装备,使角色获得新的能力。

  1. Plugins:系统能力扩展

第三类能力是 Plugins(插件)。插件用于扩展系统功能,使 Open Claw 可以连接更多外部系统,例如: GitHub、 邮件系统、 Notion、 日历服务。插件通常提供新的 API、新工具或新的通信渠道,使智能体能够在更多真实场景中发挥作用。

(五)基础运行层:操作系统环境

在最底层,是 Open Claw 的运行环境,即 操作系统层(Operating System Layer)。系统通常运行在: macOS、 Linux、 Windows。这些操作系统为 Open Claw 提供基础的运行环境,包括网络通信、文件系统以及计算资源。

三、安装与使用

(一)如何安装 Open Claw(小龙虾)

安装不难,难的是“版本匹配”

  1. 两种安装方式

一键封装版(推荐新手)。已配置好环境, 自带部分技能, 几分钟可运行。适合:体验用户 非技术用户

  1. 原版安装(推荐进阶)

基本流程:

```

git clone 项目

安装依赖(Python / Node

配置 API Key

启动系统

```

适合:开发 深度使用。

  1. 最大坑:教程“过期”

安装的时候,都会去B站、YouTube 上看视频,你会发现: B站教程跑不通、 小红书步骤不一样、 YouTube版本不一致。原因是 AI工具迭代极快(按周更新)。

正确方法是不要跟视频,要跟源头。优先看: GitHub README, 官方文档, 最新版本说明

判断教程是否可用。 发布时间 ≤ 2个月。 评论区没有“跑不通”。学会看报错(进阶关键),不要怕报错: 看 error message, 查 GitHub Issues, 让 AI 帮你 debug,个人觉得还是可以先看看视频比较好,有几个博主不错,去搜一下就知道了。

  1. 前置条件

网络环境: 很多能力依赖国外服务: 模型(OpenAI / Claude), 插件接口通常需要稳定网络环境,需要科学上网

基础环境:

Python3.10+), Node.js(部分需要)。 Git, API Key

(二)真正的核心:Skills(技能)

很多人以为: AI强 模型强,这是错的。真正决定“能不能干活”的,是: Skills(工作流能力)!

Skills 本质是把复杂任务拆成步骤的一套规则

举个例子(写报告)

没有 Skills

👉 AI:写一段话(结束)

有 Skills

1. 理解任务 2. 拆解结构 3. 搜集资料 4. 数据分析 5. 写正文 6. 输出PPT

表 1skill的分类应用

类别

具体技能(Skills

典型应用场景

🏢办公类

写报告 PPT / 数据分析

商业汇报、项目方案、数据整理

🔍信息处理

搜索总结 知识库问答

信息整合、资料检索、知识管理

⚙️自动化

定时任务 邮件发送

自动执行任务、流程自动化

🎓专业领域

教育教案 商业分析

教学设计、行业研究、决策支持

不同类型的 Skills,本质上构成了 AI 的“工作能力矩阵”

(三)实战案例|让 Open Claw 5 分钟做完一份教学方案 + PPT

  1. 问题及场景

🎯 场景:一个真实需求

作为老师,经常会遇到一个任务:

明天要上一节新课,需要一份完整的教学方案 + PPT

传统做法:

查资料(30分钟)

写教案(1小时)

PPT1小时)

👉 一共 2~3 小时起步

尝试用 Open Claw 来完成

一段指令

任务:设计一节关于“Shape World”的英语课程

对象:6-8岁学生

内容:circle, square, triangle, rectangle

要求:

1. 生成完整教案(含目标、流程、活动)

2. 设计课堂互动游戏

3. 输出一份PPT结构

  1. Open Claw实际做了什么?

Open Claw 并不是“直接回答”,而是自动完成了一整套流程:

🧠 第一步:理解任务(LLM

识别教学目标

判断学生年龄段

确定教学难度

🧭 第二步:拆解任务(Agent Runtime

教案结构设计

活动设计

PPT结构规划

🔧 第三步:调用工具(Tools

查找相关教学表达

生成互动内容

📦 第四步:按流程执行(Skills

先教案 → 再活动 → 再PPT

保证逻辑顺序正确

🔌 第五步:输出结果(Plugins

教案(Word结构)

PPT大纲(可直接生成幻灯片)

⏱ 最终结果

不到5分钟给出了一份完整教案, 3个课堂互动游戏 一套清晰的PPT结构

💡 最关键的变化,这不是“AI帮我写了一段话”而是 AI帮我完成了一整件事,Tools / Plugins 负责执行

(四)实战案例|Open Claw 如何帮企业自动完成一份行业分析报告

  1. 需求及问询描述

场景:一个典型企业需求

在企业中,有一种非常高频但又极其耗时的任务:

做一份行业分析 竞品分析报告

例如:

新项目立项

客户方案准备

市场调研

传统流程通常是: 查资料(1~2小时)、 整理信息(1小时)、 写报告(1~2小时)、 做PPT1小时)

一份报告,通常需要 半天甚至一天

让 Open Claw 来做这件事

给出的指令是

任务:分析“AI教育产品”行业现状

目标:用于企业内部汇报

内容要求:

1. 市场规模与趋势

2. 主要玩家(竞品分析)

3. 商业模式

4. 未来机会与风险

输出:

一份结构化报告

一份PPT大纲

  1. Open Claw 实际执行过程

它并不是“直接生成答案”,而是像一个分析师一样工作:

🧠 第一步:理解与建模(LLM

识别“行业分析”的标准结构

构建分析框架(市场 竞品 模式 趋势)

👉 相当于一个咨询顾问在搭报告框架

🧭 第二步:任务拆解(Agent Runtime

动拆分为多个子任务:

1. 搜集行业数据

2. 整理主要公司信息

3. 对比产品差异

4. 提炼商业模式

5. 形成结论

👉 这一步是“真正的专业能力体现”

🔧 第三步:信息获取(Tools

调用搜索工具

获取多来源资料

抓取公开信息

📊 第四步:分析与整合(Skills

按照既定工作流:

先数据 → 再对比 → 再总结

过滤无效信息

形成结构化结论

👉 这一步决定“像不像专业报告”

🔌 第五步:结果输出(Plugins

最终输出:

一份结构清晰的分析报告(Word

一套可直接用的PPT结构

⏱ 最终结果

👉 10分钟内完成:

行业结构分析

竞品对比框架

商业模式总结

PPT大纲

这不再是AI 帮你“写一段话”,而是AI 帮你“完成一项业务任务”

❗ 传统AI:信息生成工具

❗ Open Claw:任务执行系统

Open Claw,本质上是在企业中创造“数字员工”。

四、安全隐患及商业应用

Open Claw就相当于一个数字员工在帮助用户进行操作,这个过程里面获得了很大的权限,因此存在一个很大的风险,包括数据安装和过程、结果安全。比如数据是否有可能被上传到其他的地方,已有案例表明,在权限控制不当的情况下,智能体可能执行超出预期的操作。

实际上流程自动化这个领域早就已经有许多商家在做了,比如国外的#UiPath Manus,国内的#金智维 、影刀RPA等。目前小龙虾🦞使用问题不大,但是在商业上就还是有很大的问题,比如说生成结果的安全性,有效性和合规性等等就会受到一定的质疑。国内外目前提供商业数字员工为什么他们能存在?高端的商业应用中就是因为他们解决了安全性、可靠性与合规性。不会过度的去获取敏感数据,而且是在一个完全可控的环境中使用,比如说使用沙箱机制屏蔽敏感数据,不会回传给企业。在形成的流程中应为对于一个领域(如金融)都非常熟悉了,所以所以他们可以写成一个符合这个领域规范的skills,尤其是在一起非常专业、细节的应用中,所以这个流程的合规性和有效性就能得到保障。还有规则引擎,对于许多问题的解决都是根据规则来判断的,甚至还使用模糊数学、粗糙集来进行判断,对于生成的结果或者输入的数据,也有合理性判断的机制,如数据和常规的比较起来是否过于悬殊,从而提供建议。

小龙虾误删数据库案例。B站上看到一个博主的真实情况,他当时就是跟小龙虾抱怨了一下,觉得自己的机器比较卡,结果他就自作主张把数据库删除了一半,这些都是非常恐怖的事情。决策的科学性和执行的可控性都是需要重点考虑的。

重庆三峡学院85万元路由器采购事件”。20255月曝光重庆三峡学院学校采购“防火墙及DNS设备”,中标价格:约85万元,实际设备:一款普通路由器(型号 TL-R473G)市场价:约300元左右。投标公司 用假材料参与投标,直接拿普通路由器冒充专业设备,评审专家 没有核查型号,学校相关人员 未认真把关就确认结果,整个流程集体失效。商业数字员工公司会根据这个事件做针对性的梳理和判断,在规则上优化。针对 “形式合规,实质失效”,流程看起来完整,但没人真正负责。 信息不对称 专业缺失,评标专家甚至没核查设备型号。风险传导失效,中间有人发现异常,但:没人愿意“叫停流程”。会在规范 skills、形成制度性防范方法上构建新的tools和规则引擎。在安全和准确性上面的应用中,人类专家的参与是必须的,所以 HI + AI 共同治理这个社会才是一个最合理逻辑。

Open Claw 的确通过做事情解放了人类大量的工作,但是也有风险,在使用过程中,哪怕是纯粹个人应用也需要有一定的防范意识,而商业或者政务应用,建议还是使用商业化的数字员工!

Open Claw,不是一个工具。它是一个可以替你工作的数字助理。未来的差距,不在于谁会用AI,而在于谁拥有“更强的数字员工”。当然安全性要求严格的,还是使用商业软件公司提供的数字员工。

                                            作者:李伟