Open Claw ,小龙虾的前世今生

如果网上疯传的小龙虾🦞，你还以为是一种动物，那就大大落伍了。春节后，最火的是什么，一定是Open Claw。下面我们就来会会这只著名的龙虾。

Open Claw 可以理解为一种个人助理型智能体运行系统（Personal Agent Runtime）。它并不是简单的聊天机器人，而是一个以大语言模型（LLM）为核心决策引擎、在一定的规则（Skills）指导下，能够调用工具并连接外部系统的智能体平台。从系统结构上看，Open Claw 采用了一种典型的分层架构。整体系统可以自上而下划分为四个层次：交互层、平台层、能力层和基础运行层。

OpenClaw 不是公司产品，而是一个开源个人项目。它由奥地利开发者 Peter Steinberger 创建，Steinberger 是 PSPDFKit 的创始人。该软件前身是他开发的 AI 虚拟助手 Clawd，最终更名为 OpenClaw。目前 Steinberger 已加入 OpenAI。

一、初步理解Open Claw

（一）一个“会做事”的数字助理

如果把当前主流的 AI 工具做一个简单分类，其实可以分成两类：

图1：两类不同能力的 AI

前者的代表，是我们熟悉的大语言模型——它们能够回答问题、生成文本、进行推理，甚至在某些场景下表现出接近人类的理解能力。但无论能力多强，本质上仍然停留在一个阶段：回答问题。

而后者，则正在成为新的方向。用户不再只是问：这个问题的答案是什么？而是开始提出：帮我完成一件事情。例如：帮我整理今天的 AI 新闻并生成摘要，帮我查找数据并写一份分析报告，帮我监控某个信息源并定期提醒。在这些场景中，单纯的“回答”已经不够，AI 必须具备另一种能力：行动能力。Open Claw，正是在这样的背景下出现的一类系统。

（二）把 Open Claw 看成一个“电子秘书”

如果直接从技术角度解释 Open Claw，很容易让人陷入术语之中。因此，我们不妨先换一种方式理解：把 Open Claw 看成一个个人数字秘书。这个秘书并不是一个简单的聊天机器人，而是一个能够思考、决策并执行任务的系统。为了理解它的工作方式，我们可以把它拆解成几个“角色”。

大脑：LLM

在这个系统中，大语言模型（LLM）相当于秘书的大脑。它负责：理解用户的需求、分析问题、推导解决方案、生成语言表达。

例如，当你说：帮我整理今天关于人工智能的新闻。LLM 会首先做出判断：需要搜索信息、需要筛选来源、需要进行总结。也就是说，它解决的是：应该做什么。

神经中枢+调度系统：Agent Runtime

但一个优秀的秘书，仅有“会思考的大脑”是不够的。还需要有一套机制来决定：先做什么、后做什么、在什么条件下执行、调用哪些工具。这套机制，在 Open Claw 中被称为：Agent Runtime（智能体运行系统/时）。如果说 LLM 是“大脑”，那么 Agent Runtime 就是“神经中枢 + 调度系统”。

它包含几个关键能力：任务规划（Planner）：把复杂任务拆解成步骤、上下文记忆（Memory）：结合当前与历史信息进行判断、工具路由（Tool Routing）：选择合适的执行方式、通道适配（Channel Adapter）：将结果输出到不同平台。它决定这个数字秘书如何行动。

图2:小龙虾的傍身技能

3.手和脚：Tools

思考和决策之后，接下来必须真正去“做事”。这就需要 Tools。Tools 可以理解为秘书的“手和脚”，负责执行具体动作，例如：浏览网页、搜索信息、发送消息、读取 PDF、执行定时任务。

工作流程手册：Skills

但在真实世界中，一个专业秘书不仅仅依赖“能力”，还会遵循一套工作规范。例如：做报告时应先查资料，再整理结构，重要信息必须优先参考权威来源，输出需要符合既定格式。在 Open Claw 中，这部分就是：Skills。Skills 并不直接提供新的能力，而是定义：在什么条件下触发任务，完成任务需要遵循哪些步骤，每一步如何调用工具，输出需要满足什么规范。

Skills 的本质是：该怎么做，把模糊的任务，转化为结构化的工作流程。

外部设备：Plugins

一个秘书在工作中，往往还会借助外部工具，例如： SPSS 进行数据分析、 Word 生成文档、 PowerPoint 制作演示、各类系统 API（如接入财务数据、GitHub下载应用）。在 Open Claw 中，这些能力通过 Plugins（插件）接入。插件的作用，是让智能体可以连接外部系统，从而突破自身能力边界。

前台与调度：Gateway

有一个容易被忽略的角色：Gateway（网关），它就像办公室的前台或调度中心，负责：接收用户请求、进行权限校验、将任务分发给对应的智能体。它并不参与“思考”，但决定了系统的入口与流转秩序。

图3: Open Claw 的拟人化理解

（三）为什么叫“小龙虾”？

“Open Claw”中的 Claw，本意是“爪子”。

在国内开发者社区中，它被形象地称为：小龙虾。这个名字其实并不只是玩笑。从结构上看，智能体真正与现实世界发生交互的，不是“大脑”，而是“执行能力”——也就是那些工具调用机制。这些能力，就像一只小龙虾的钳子：能抓取信息、能搬运数据、能操作系统。也正是这些“钳子”，让 AI 从一个“会说话的模型”，变成一个“可以做事的系统”。

但如果要真正理解它的能力边界与设计逻辑，仅靠类比还不够。从工程角度来看，这个“数字秘书”其实是一个分层的系统结构。

二、Open Claw 运行原理分析

从工程角度看，这种结构类似于一个“智能体操作环境”：用户通过各种通信渠道进入系统，平台层负责协调和调度智能体，智能体以 LLM 为核心进行分析与决策，并通过能力层调用各种工具或插件完成真实任务。在这个过程中，通过 skills形成的规则和触发条件，让上面的行为合理有序。

下面我们按照图4:Open Claw 个人智能体系统架构中的结构，对其运行机制逐层展开。

图4:Open Claw 个人智能体系统架构

（一）交互层：人与智能体的接口

系统的最上层是交互层（Interaction Layer）。这一层并不承担智能决策，而是负责人与系统之间的信息交换。在实际部署中，Open Claw 可以接入多种常见的通信渠道，例如：WhatsApp、 Telegram、 Slack、 Discord、微信等即时通信平台。这些平台在系统中被抽象为 Channel（通道）。用户发送的每一条消息，都会通过这些通道进入 Open Claw 系统。

从系统架构角度看，这一层的角色与互联网系统中的接口层（Interface Layer）非常类似。它解决的是一个非常基础的问题：用户如何进入系统并与智能体交互。

（二）平台层：系统调度与运行环境

交互层之下，是 Open Claw 的平台层（Platform Layer）。这一层的核心组件是 Gateway（网关）。Gateway 在系统中承担两种角色：1. 消息网关（Message Gateway）。2. 控制平面（Control Plane）

作为消息网关，它负责接收来自不同通信渠道的消息，并将这些消息统一转换为系统内部的标准格式。作为控制平面，它负责：管理智能体实例、维护系统会话（Session）、调度任务、返回处理结果。

当用户发送一条消息时，Gateway 会首先创建或恢复一个 Session（会话）。Session 可以理解为一个对话上下文容器，其中保存着：、历史对话记录、任务状态、工具调用结果。随后，Gateway 会将当前会话中的问题转交给 Agent（智能体）进行处理。

（三）智能体层：LLM 驱动的决策系统

Open Claw 的核心，是系统中的 Agent（智能体）。在结构上，Agent 并不是单一模块，而是一组协同工作的组件，其核心是大语言模型（LLM）。LLM 在智能体中的角色，可以理解为决策引擎（Reasoning Engine）。当用户请求进入系统时，LLM 会对问题进行语义理解、任务分解和策略生成。

围绕 LLM，智能体内部通常还包含几个关键组件：

Planner（任务规划器）：负责将复杂任务拆解为一系列可执行步骤。

Memory（上下文记忆）：用于保存对话历史和任务状态，使智能体具有连续对话能力。

Routing（路由机制）：决定当前任务需要调用哪些工具或能力模块。

Channel Adapter（通道适配）：用于将结果返回给用户所在的平台。

在这一过程中，LLM 并不会直接执行现实操作，而是完成三个关键步骤：

1. 分析（Reasoning）

2. 选择能力（Tool Selection）

3. 生成结果（Generation）

换句话说，智能体负责思考和决策，而真正执行操作的，是下一层的能力系统。

（四）能力层：智能体行动的基础

在 Open Claw 中，智能体的行动能力来源于能力层（Capability Layer）。这一层包含三类不同的能力模块：内置工具（Tools）、技能规则（Skills）、扩展插件（Plugins）。它们分别解决不同的问题。

Tools：执行真实操作

Tools 是系统中最直接的执行能力，例如：浏览网页、搜索互联网、发送消息、读取 PDF 文件、定时任务（cron）。这些工具可以理解为智能体的基本操作能力。当 LLM 决定执行某项任务时，会通过系统调用这些工具完成实际操作。

Skills：智能体的行为规则

如果说 Tools 决定了智能体能做什么，那么 Skills 决定的是智能体应该如何去做。Skills 通常以 `SKILL.md` 文件的形式存在，其中描述的是：技能说明、行为规则、触发条件、工具使用方法。从本质上看，Skills 更像是一种 AI 工作流程规范（AI Workflow）。它为 LLM 提供了一种结构化的操作指南，使智能体能够按照特定逻辑完成任务。

Tools 相当于角色自带的技能，可以执行具体动作， Skills 则像技能的使用规则或战术组合， Plugins 则类似于外挂装备，使角色获得新的能力。

Plugins：系统能力扩展

第三类能力是 Plugins（插件）。插件用于扩展系统功能，使 Open Claw 可以连接更多外部系统，例如： GitHub、邮件系统、 Notion、日历服务。插件通常提供新的 API、新工具或新的通信渠道，使智能体能够在更多真实场景中发挥作用。

（五）基础运行层：操作系统环境

在最底层，是 Open Claw 的运行环境，即操作系统层（Operating System Layer）。系统通常运行在： macOS、 Linux、 Windows。这些操作系统为 Open Claw 提供基础的运行环境，包括网络通信、文件系统以及计算资源。

三、安装与使用

（一）如何安装 Open Claw（小龙虾）

安装不难，难的是“版本匹配”

两种安装方式

一键封装版（推荐新手）。已配置好环境，自带部分技能，几分钟可运行。适合：体验用户 / 非技术用户

原版安装（推荐进阶）

基本流程：

```

git clone 项目

安装依赖（Python / Node）

配置 API Key

启动系统

```

适合：开发 / 深度使用。

最大坑：教程“过期”

安装的时候，都会去B站、YouTube 上看视频，你会发现： B站教程跑不通、小红书步骤不一样、 YouTube版本不一致。原因是 AI工具迭代极快（按周更新）。

正确方法是不要跟视频，要跟源头。优先看： GitHub README，官方文档，最新版本说明

判断教程是否可用。发布时间 ≤ 2个月。评论区没有“跑不通”。学会看报错（进阶关键），不要怕报错：看 error message，查 GitHub Issues，让 AI 帮你 debug，个人觉得还是可以先看看视频比较好，有几个博主不错，去搜一下就知道了。

前置条件

网络环境：很多能力依赖国外服务：模型（OpenAI / Claude），插件接口通常需要稳定网络环境，需要科学上网

基础环境：

Python（3.10+）， Node.js（部分需要）。 Git， API Key

（二）真正的核心：Skills（技能）

很多人以为： AI强 = 模型强，这是错的。真正决定“能不能干活”的，是： Skills（工作流能力）！

Skills 本质是把复杂任务拆成步骤的一套规则

举个例子（写报告）

没有 Skills：

👉 AI：写一段话（结束）

有 Skills：

1. 理解任务 2. 拆解结构 3. 搜集资料 4. 数据分析 5. 写正文 6. 输出PPT

表 1skill的分类应用

类别	具体技能（Skills）	典型应用场景
🏢办公类	写报告 / 做PPT / 数据分析	商业汇报、项目方案、数据整理
🔍信息处理	搜索总结 / 知识库问答	信息整合、资料检索、知识管理
⚙️自动化	定时任务 / 邮件发送	自动执行任务、流程自动化
🎓专业领域	教育教案 / 商业分析	教学设计、行业研究、决策支持

不同类型的 Skills，本质上构成了 AI 的“工作能力矩阵”

（三）实战案例｜让 Open Claw 5 分钟做完一份教学方案 + PPT

问题及场景

🎯 场景：一个真实需求

作为老师，经常会遇到一个任务：

明天要上一节新课，需要一份完整的教学方案 + PPT

传统做法：

查资料（30分钟）

写教案（1小时）

做PPT（1小时）

👉 一共 2~3 小时起步

尝试用 Open Claw 来完成

一段指令：

任务：设计一节关于“Shape World”的英语课程

对象：6-8岁学生

内容：circle, square, triangle, rectangle

要求：

1. 生成完整教案（含目标、流程、活动）

2. 设计课堂互动游戏

3. 输出一份PPT结构

Open Claw实际做了什么？

Open Claw 并不是“直接回答”，而是自动完成了一整套流程：

🧠 第一步：理解任务（LLM）

识别教学目标

判断学生年龄段

确定教学难度

🧭 第二步：拆解任务（Agent Runtime）

教案结构设计

活动设计

PPT结构规划

🔧 第三步：调用工具（Tools）

查找相关教学表达

生成互动内容

📦 第四步：按流程执行（Skills）

先教案 → 再活动 → 再PPT

保证逻辑顺序正确

🔌 第五步：输出结果（Plugins）

教案（Word结构）

PPT大纲（可直接生成幻灯片）

⏱ 最终结果

不到5分钟给出了一份完整教案， 3个课堂互动游戏一套清晰的PPT结构

💡 最关键的变化，这不是“AI帮我写了一段话”而是 AI帮我完成了一整件事，Tools / Plugins 负责执行

（四）实战案例｜Open Claw 如何帮企业自动完成一份行业分析报告

需求及问询描述

场景：一个典型企业需求

在企业中，有一种非常高频但又极其耗时的任务：

做一份行业分析 / 竞品分析报告

例如：

新项目立项

客户方案准备

市场调研

传统流程通常是：查资料（1~2小时）、整理信息（1小时）、写报告（1~2小时）、做PPT（1小时）

一份报告，通常需要半天甚至一天

让 Open Claw 来做这件事

给出的指令是：

任务：分析“AI教育产品”行业现状

目标：用于企业内部汇报

内容要求：

1. 市场规模与趋势

2. 主要玩家（竞品分析）

3. 商业模式

4. 未来机会与风险

输出：

- 一份结构化报告

- 一份PPT大纲

Open Claw 实际执行过程

它并不是“直接生成答案”，而是像一个分析师一样工作：

🧠 第一步：理解与建模（LLM）

识别“行业分析”的标准结构

构建分析框架（市场 / 竞品 / 模式 / 趋势）

👉 相当于一个咨询顾问在搭报告框架

🧭 第二步：任务拆解（Agent Runtime）

动拆分为多个子任务：

1. 搜集行业数据

2. 整理主要公司信息

3. 对比产品差异

4. 提炼商业模式

5. 形成结论

👉 这一步是“真正的专业能力体现”

🔧 第三步：信息获取（Tools）

调用搜索工具

获取多来源资料

抓取公开信息

📊 第四步：分析与整合（Skills）

按照既定工作流：

先数据 → 再对比 → 再总结

过滤无效信息

形成结构化结论

👉 这一步决定“像不像专业报告”

🔌 第五步：结果输出（Plugins）

最终输出：

一份结构清晰的分析报告（Word）

一套可直接用的PPT结构

⏱ 最终结果

👉 10分钟内完成：

行业结构分析

竞品对比框架

商业模式总结

PPT大纲

这不再是AI 帮你“写一段话”，而是AI 帮你“完成一项业务任务”

❗ 传统AI：信息生成工具

❗ Open Claw：任务执行系统

Open Claw，本质上是在企业中创造“数字员工”。

四、安全隐患及商业应用

Open Claw就相当于一个数字员工在帮助用户进行操作，这个过程里面获得了很大的权限，因此存在一个很大的风险，包括数据安装和过程、结果安全。比如数据是否有可能被上传到其他的地方，已有案例表明，在权限控制不当的情况下，智能体可能执行超出预期的操作。

实际上流程自动化这个领域早就已经有许多商家在做了，比如国外的#UiPath ，Manus，国内的#金智维、影刀RPA等。目前小龙虾🦞使用问题不大，但是在商业上就还是有很大的问题，比如说生成结果的安全性，有效性和合规性等等就会受到一定的质疑。国内外目前提供商业数字员工为什么他们能存在？高端的商业应用中就是因为他们解决了安全性、可靠性与合规性。不会过度的去获取敏感数据，而且是在一个完全可控的环境中使用，比如说使用沙箱机制屏蔽敏感数据，不会回传给企业。在形成的流程中应为对于一个领域（如金融）都非常熟悉了，所以所以他们可以写成一个符合这个领域规范的skills，尤其是在一起非常专业、细节的应用中，所以这个流程的合规性和有效性就能得到保障。还有规则引擎，对于许多问题的解决都是根据规则来判断的，甚至还使用模糊数学、粗糙集来进行判断，对于生成的结果或者输入的数据，也有合理性判断的机制，如数据和常规的比较起来是否过于悬殊，从而提供建议。

小龙虾误删数据库案例。B站上看到一个博主的真实情况，他当时就是跟小龙虾抱怨了一下，觉得自己的机器比较卡，结果他就自作主张把数据库删除了一半，这些都是非常恐怖的事情。决策的科学性和执行的可控性都是需要重点考虑的。

“重庆三峡学院85万元路由器采购事件”。2025年5月曝光重庆三峡学院学校采购“防火墙及DNS设备”，中标价格：约85万元，实际设备：一款普通路由器（型号 TL-R473G）市场价：约300元左右。投标公司用假材料参与投标，直接拿普通路由器冒充专业设备，评审专家没有核查型号，学校相关人员未认真把关就确认结果，整个流程集体失效。商业数字员工公司会根据这个事件做针对性的梳理和判断，在规则上优化。针对 “形式合规，实质失效”，流程看起来完整，但没人真正负责。信息不对称 + 专业缺失，评标专家甚至没核查设备型号。风险传导失效，中间有人发现异常，但：没人愿意“叫停流程”。会在规范 skills、形成制度性防范方法上构建新的tools和规则引擎。在安全和准确性上面的应用中，人类专家的参与是必须的，所以 HI + AI 共同治理这个社会才是一个最合理逻辑。

Open Claw 的确通过做事情解放了人类大量的工作，但是也有风险，在使用过程中，哪怕是纯粹个人应用也需要有一定的防范意识，而商业或者政务应用，建议还是使用商业化的数字员工！

Open Claw，不是一个工具。它是一个可以替你工作的数字助理。未来的差距，不在于谁会用AI，而在于谁拥有“更强的数字员工”。当然安全性要求严格的，还是使用商业软件公司提供的数字员工。

作者：李伟

一、初步理解Open Claw

（一）一个“会做事”的数字助理

（二）把 Open Claw 看成一个“电子秘书”

大脑：LLM

神经中枢+调度系统：Agent Runtime

3.手和脚：Tools

工作流程手册：Skills

外部设备：Plugins

前台与调度：Gateway

（三）为什么叫“小龙虾”？

二、Open Claw 运行原理分析

（一）交互层：人与智能体的接口

（二）平台层：系统调度与运行环境

（三）智能体层：LLM 驱动的决策系统

（四）能力层：智能体行动的基础

Tools：执行真实操作

Skills：智能体的行为规则

Plugins：系统能力扩展

（五）基础运行层：操作系统环境

三、安装与使用

（一）如何安装 Open Claw（小龙虾）

两种安装方式

原版安装（推荐进阶）

最大坑：教程“过期”

前置条件

（二）真正的核心：Skills（技能）

（三）实战案例｜让 Open Claw 5 分钟做完一份教学方案 + PPT

问题及场景

Open Claw实际做了什么？

（四）实战案例｜Open Claw 如何帮企业自动完成一份行业分析报告

需求及问询描述

Open Claw 实际执行过程

四、安全隐患及商业应用