如果网上疯传的小龙虾🦞,你还以为是一种动物,那就大大落伍了。春节后,最火的是什么,一定是Open Claw。下面我们就来会会这只著名的龙虾。
Open Claw 可以理解为一种 个人助理型智能体运行系统(Personal Agent Runtime)。它并不是简单的聊天机器人,而是一个以大语言模型(LLM)为核心决策引擎、在一定的规则(Skills)指导下,能够调用工具并连接外部系统的 智能体平台。从系统结构上看,Open Claw 采用了一种典型的 分层架构。整体系统可以自上而下划分为四个层次:交互层、平台层、能力层和基础运行层。
OpenClaw 不是公司产品,而是一个开源个人项目。它由奥地利开发者 Peter Steinberger 创建,Steinberger 是 PSPDFKit 的创始人。该软件前身是他开发的 AI 虚拟助手 Clawd,最终更名为 OpenClaw。 目前 Steinberger 已加入 OpenAI。
一、初步理解Open Claw
(一)一个“会做事”的数字助理
如果把当前主流的 AI 工具做一个简单分类,其实可以分成两类:

图1:两类不同能力的 AI
前者的代表,是我们熟悉的大语言模型——它们能够回答问题、生成文本、进行推理,甚至在某些场景下表现出接近人类的理解能力。但无论能力多强,本质上仍然停留在一个阶段:回答问题。
而后者,则正在成为新的方向。用户不再只是问:这个问题的答案是什么?而是开始提出:帮我完成一件事情。例如: 帮我整理今天的 AI 新闻并生成摘要, 帮我查找数据并写一份分析报告, 帮我监控某个信息源并定期提醒。在这些场景中,单纯的“回答”已经不够,AI 必须具备另一种能力:行动能力。Open Claw,正是在这样的背景下出现的一类系统。
(二)把 Open Claw 看成一个“电子秘书”
如果直接从技术角度解释 Open Claw,很容易让人陷入术语之中。因此,我们不妨先换一种方式理解:把 Open Claw 看成一个个人数字秘书。这个秘书并不是一个简单的聊天机器人,而是一个能够思考、决策并执行任务的系统。为了理解它的工作方式,我们可以把它拆解成几个“角色”。
大脑:LLM
在这个系统中,大语言模型(LLM)相当于秘书的大脑。它负责: 理解用户的需求、 分析问题、 推导解决方案、 生成语言表达。
例如,当你说:帮我整理今天关于人工智能的新闻。LLM 会首先做出判断: 需要搜索信息、 需要筛选来源、 需要进行总结。也就是说,它解决的是:应该做什么。
神经中枢+调度系统:Agent Runtime
但一个优秀的秘书,仅有“会思考的大脑”是不够的。还需要有一套机制来决定: 先做什么、 后做什么、 在什么条件下执行、 调用哪些工具。这套机制,在 Open Claw 中被称为:Agent Runtime(智能体运行系统/时)。如果说 LLM 是“大脑”,那么 Agent Runtime 就是“神经中枢 + 调度系统”。
它包含几个关键能力:任务规划(Planner):把复杂任务拆解成步骤、 上下文记忆(Memory):结合当前与历史信息进行判断、 工具路由(Tool Routing):选择合适的执行方式、 通道适配(Channel Adapter):将结果输出到不同平台。它决定这个数字秘书如何行动。

图2:小龙虾的傍身技能
3.手和脚:Tools
思考和决策之后,接下来必须真正去“做事”。这就需要 Tools。Tools 可以理解为秘书的“手和脚”,负责执行具体动作,例如:浏览网页、 搜索信息、发送消息、 读取 PDF、 执行定时任务。
工作流程手册:Skills
但在真实世界中,一个专业秘书不仅仅依赖“能力”,还会遵循一套工作规范。例如: 做报告时应先查资料,再整理结构, 重要信息必须优先参考权威来源, 输出需要符合既定格式。在 Open Claw 中,这部分就是:Skills。Skills 并不直接提供新的能力,而是定义: 在什么条件下触发任务, 完成任务需要遵循哪些步骤, 每一步如何调用工具, 输出需要满足什么规范。
Skills 的本质是:该怎么做,把模糊的任务,转化为结构化的工作流程。
外部设备:Plugins
一个秘书在工作中,往往还会借助外部工具,例如: SPSS 进行数据分析、 Word 生成文档、 PowerPoint 制作演示、 各类系统 API(如接入财务数据、GitHub下载应用)。在 Open Claw 中,这些能力通过 Plugins(插件) 接入。插件的作用,是让智能体可以连接外部系统,从而突破自身能力边界。
前台与调度:Gateway
有一个容易被忽略的角色:Gateway(网关),它就像办公室的前台或调度中心,负责: 接收用户请求、 进行权限校验、 将任务分发给对应的智能体。它并不参与“思考”,但决定了系统的入口与流转秩序。

图3: Open Claw 的拟人化理解
(三)为什么叫“小龙虾”?
“Open Claw”中的 Claw,本意是“爪子”。
在国内开发者社区中,它被形象地称为:小龙虾。这个名字其实并不只是玩笑。从结构上看,智能体真正与现实世界发生交互的,不是“大脑”,而是“执行能力”——也就是那些工具调用机制。这些能力,就像一只小龙虾的钳子: 能抓取信息、 能搬运数据、能操作系统。也正是这些“钳子”,让 AI 从一个“会说话的模型”,变成一个“可以做事的系统”。
但如果要真正理解它的能力边界与设计逻辑,仅靠类比还不够。从工程角度来看,这个“数字秘书”其实是一个分层的系统结构。
二、Open Claw 运行原理分析
从工程角度看,这种结构类似于一个“智能体操作环境”:用户通过各种通信渠道进入系统,平台层负责协调和调度智能体,智能体以 LLM 为核心进行分析与决策,并通过能力层调用各种工具或插件完成真实任务。在这个过程中,通过 skills形成的规则和触发条件,让上面的行为合理有序。
下面我们按照图4:Open Claw 个人智能体系统架构 中的结构,对其运行机制逐层展开。

图4:Open Claw 个人智能体系统架构
(一)交互层:人与智能体的接口
系统的最上层是 交互层(Interaction Layer)。这一层并不承担智能决策,而是负责 人与系统之间的信息交换。在实际部署中,Open Claw 可以接入多种常见的通信渠道,例如:WhatsApp、 Telegram、 Slack、 Discord、 微信等即时通信平台。这些平台在系统中被抽象为 Channel(通道)。用户发送的每一条消息,都会通过这些通道进入 Open Claw 系统。
从系统架构角度看,这一层的角色与互联网系统中的 接口层(Interface Layer)非常类似。它解决的是一个非常基础的问题:用户如何进入系统并与智能体交互。
(二)平台层:系统调度与运行环境
交互层之下,是 Open Claw 的 平台层(Platform Layer)。这一层的核心组件是 Gateway(网关)。Gateway 在系统中承担两种角色:1. 消息网关(Message Gateway)。2. 控制平面(Control Plane)
作为消息网关,它负责接收来自不同通信渠道的消息,并将这些消息统一转换为系统内部的标准格式。作为控制平面,它负责: 管理智能体实例、 维护系统会话(Session)、 调度任务、 返回处理结果。
当用户发送一条消息时,Gateway 会首先创建或恢复一个 Session(会话)。Session 可以理解为一个 对话上下文容器,其中保存着:、历史对话记录、 任务状态、 工具调用结果。随后,Gateway 会将当前会话中的问题转交给 Agent(智能体)进行处理。
(三)智能体层:LLM 驱动的决策系统
Open Claw 的核心,是系统中的 Agent(智能体)。在结构上,Agent 并不是单一模块,而是一组协同工作的组件,其核心是 大语言模型(LLM)。LLM 在智能体中的角色,可以理解为 决策引擎(Reasoning Engine)。当用户请求进入系统时,LLM 会对问题进行语义理解、任务分解和策略生成。
围绕 LLM,智能体内部通常还包含几个关键组件:
Planner(任务规划器): 负责将复杂任务拆解为一系列可执行步骤。
Memory(上下文记忆): 用于保存对话历史和任务状态,使智能体具有连续对话能力。
Routing(路由机制): 决定当前任务需要调用哪些工具或能力模块。
Channel Adapter(通道适配): 用于将结果返回给用户所在的平台。
在这一过程中,LLM 并不会直接执行现实操作,而是完成三个关键步骤:
1. 分析(Reasoning)
2. 选择能力(Tool Selection)
3. 生成结果(Generation)
换句话说,智能体负责 思考和决策,而真正执行操作的,是下一层的能力系统。
(四)能力层:智能体行动的基础
在 Open Claw 中,智能体的行动能力来源于 能力层(Capability Layer)。这一层包含三类不同的能力模块: 内置工具(Tools)、 技能规则(Skills)、 扩展插件(Plugins)。它们分别解决不同的问题。
Tools:执行真实操作
Tools 是系统中最直接的执行能力,例如: 浏览网页、 搜索互联网、 发送消息、 读取 PDF 文件、 定时任务(cron)。这些工具可以理解为 智能体的基本操作能力。当 LLM 决定执行某项任务时,会通过系统调用这些工具完成实际操作。
Skills:智能体的行为规则
如果说 Tools 决定了 智能体能做什么,那么 Skills 决定的是 智能体应该如何去做。Skills 通常以 `SKILL.md` 文件的形式存在,其中描述的是: 技能说明、 行为规则、 触发条件、 工具使用方法。从本质上看,Skills 更像是一种 AI 工作流程规范(AI Workflow)。它为 LLM 提供了一种结构化的操作指南,使智能体能够按照特定逻辑完成任务。
Tools 相当于角色自带的技能,可以执行具体动作, Skills 则像技能的使用规则或战术组合, Plugins 则类似于外挂装备,使角色获得新的能力。
Plugins:系统能力扩展
第三类能力是 Plugins(插件)。插件用于扩展系统功能,使 Open Claw 可以连接更多外部系统,例如: GitHub、 邮件系统、 Notion、 日历服务。插件通常提供新的 API、新工具或新的通信渠道,使智能体能够在更多真实场景中发挥作用。
(五)基础运行层:操作系统环境
在最底层,是 Open Claw 的运行环境,即 操作系统层(Operating System Layer)。系统通常运行在: macOS、 Linux、 Windows。这些操作系统为 Open Claw 提供基础的运行环境,包括网络通信、文件系统以及计算资源。
三、安装与使用
(一)如何安装 Open Claw(小龙虾)
安装不难,难的是“版本匹配”
两种安装方式
一键封装版(推荐新手)。已配置好环境, 自带部分技能, 几分钟可运行。适合:体验用户 / 非技术用户
原版安装(推荐进阶)
基本流程:
```
git clone 项目
安装依赖(Python / Node)
配置 API Key
启动系统
```
适合:开发 / 深度使用。
最大坑:教程“过期”
安装的时候,都会去B站、YouTube 上看视频,你会发现: B站教程跑不通、 小红书步骤不一样、 YouTube版本不一致。原因是 AI工具迭代极快(按周更新)。
正确方法是不要跟视频,要跟源头。优先看: GitHub README, 官方文档, 最新版本说明
判断教程是否可用。 发布时间 ≤ 2个月。 评论区没有“跑不通”。学会看报错(进阶关键),不要怕报错: 看 error message, 查 GitHub Issues, 让 AI 帮你 debug,个人觉得还是可以先看看视频比较好,有几个博主不错,去搜一下就知道了。
前置条件
网络环境: 很多能力依赖国外服务: 模型(OpenAI / Claude), 插件接口通常需要稳定网络环境,需要科学上网
基础环境:
Python(3.10+), Node.js(部分需要)。 Git, API Key
(二)真正的核心:Skills(技能)
很多人以为: AI强 = 模型强,这是错的。真正决定“能不能干活”的,是: Skills(工作流能力)!
Skills 本质是把复杂任务拆成步骤的一套规则
举个例子(写报告)
没有 Skills:
👉 AI:写一段话(结束)
有 Skills:
1. 理解任务 2. 拆解结构 3. 搜集资料 4. 数据分析 5. 写正文 6. 输出PPT
表 1skill的分类应用
类别 | 具体技能(Skills) | 典型应用场景 |
🏢办公类 | 写报告 / 做PPT / 数据分析 | 商业汇报、项目方案、数据整理 |
🔍信息处理 | 搜索总结 / 知识库问答 | 信息整合、资料检索、知识管理 |
⚙️自动化 | 定时任务 / 邮件发送 | 自动执行任务、流程自动化 |
🎓专业领域 | 教育教案 / 商业分析 | 教学设计、行业研究、决策支持 |
不同类型的 Skills,本质上构成了 AI 的“工作能力矩阵”
(三)实战案例|让 Open Claw 5 分钟做完一份教学方案 + PPT
问题及场景
🎯 场景:一个真实需求
作为老师,经常会遇到一个任务:
明天要上一节新课,需要一份完整的教学方案 + PPT
传统做法:
查资料(30分钟)
写教案(1小时)
做PPT(1小时)
👉 一共 2~3 小时起步
尝试用 Open Claw 来完成
一段指令:
任务:设计一节关于“Shape World”的英语课程
对象:6-8岁学生
内容:circle, square, triangle, rectangle
要求:
1. 生成完整教案(含目标、流程、活动)
2. 设计课堂互动游戏
3. 输出一份PPT结构
Open Claw实际做了什么?
Open Claw 并不是“直接回答”,而是自动完成了一整套流程:
🧠 第一步:理解任务(LLM)
识别教学目标
判断学生年龄段
确定教学难度
🧭 第二步:拆解任务(Agent Runtime)
教案结构设计
活动设计
PPT结构规划
🔧 第三步:调用工具(Tools)
查找相关教学表达
生成互动内容
📦 第四步:按流程执行(Skills)
先教案 → 再活动 → 再PPT
保证逻辑顺序正确
🔌 第五步:输出结果(Plugins)
教案(Word结构)
PPT大纲(可直接生成幻灯片)
⏱ 最终结果
不到5分钟给出了一份完整教案, 3个课堂互动游戏 一套清晰的PPT结构
💡 最关键的变化,这不是“AI帮我写了一段话”而是 AI帮我完成了一整件事,Tools / Plugins 负责执行
(四)实战案例|Open Claw 如何帮企业自动完成一份行业分析报告
需求及问询描述
场景:一个典型企业需求
在企业中,有一种非常高频但又极其耗时的任务:
做一份行业分析 / 竞品分析报告
例如:
新项目立项
客户方案准备
市场调研
传统流程通常是: 查资料(1~2小时)、 整理信息(1小时)、 写报告(1~2小时)、 做PPT(1小时)
一份报告,通常需要 半天甚至一天
让 Open Claw 来做这件事
给出的指令是:
任务:分析“AI教育产品”行业现状
目标:用于企业内部汇报
内容要求:
1. 市场规模与趋势
2. 主要玩家(竞品分析)
3. 商业模式
4. 未来机会与风险
输出:
- 一份结构化报告
- 一份PPT大纲
Open Claw 实际执行过程
它并不是“直接生成答案”,而是像一个分析师一样工作:
🧠 第一步:理解与建模(LLM)
识别“行业分析”的标准结构
构建分析框架(市场 / 竞品 / 模式 / 趋势)
👉 相当于一个咨询顾问在搭报告框架
🧭 第二步:任务拆解(Agent Runtime)
动拆分为多个子任务:
1. 搜集行业数据
2. 整理主要公司信息
3. 对比产品差异
4. 提炼商业模式
5. 形成结论
👉 这一步是“真正的专业能力体现”
🔧 第三步:信息获取(Tools)
调用搜索工具
获取多来源资料
抓取公开信息
📊 第四步:分析与整合(Skills)
按照既定工作流:
先数据 → 再对比 → 再总结
过滤无效信息
形成结构化结论
👉 这一步决定“像不像专业报告”
🔌 第五步:结果输出(Plugins)
最终输出:
一份结构清晰的分析报告(Word)
一套可直接用的PPT结构
⏱ 最终结果
👉 10分钟内完成:
行业结构分析
竞品对比框架
商业模式总结
PPT大纲
这不再是AI 帮你“写一段话”,而是AI 帮你“完成一项业务任务”
❗ 传统AI:信息生成工具
❗ Open Claw:任务执行系统
Open Claw,本质上是在企业中创造“数字员工”。
四、安全隐患及商业应用
Open Claw就相当于一个数字员工在帮助用户进行操作,这个过程里面获得了很大的权限,因此存在一个很大的风险,包括数据安装和过程、结果安全。比如数据是否有可能被上传到其他的地方,已有案例表明,在权限控制不当的情况下,智能体可能执行超出预期的操作。
实际上流程自动化这个领域早就已经有许多商家在做了,比如国外的#UiPath ,Manus,国内的#金智维 、影刀RPA等。目前小龙虾🦞使用问题不大,但是在商业上就还是有很大的问题,比如说生成结果的安全性,有效性和合规性等等就会受到一定的质疑。国内外目前提供商业数字员工为什么他们能存在?高端的商业应用中就是因为他们解决了安全性、可靠性与合规性。不会过度的去获取敏感数据,而且是在一个完全可控的环境中使用,比如说使用沙箱机制屏蔽敏感数据,不会回传给企业。在形成的流程中应为对于一个领域(如金融)都非常熟悉了,所以所以他们可以写成一个符合这个领域规范的skills,尤其是在一起非常专业、细节的应用中,所以这个流程的合规性和有效性就能得到保障。还有规则引擎,对于许多问题的解决都是根据规则来判断的,甚至还使用模糊数学、粗糙集来进行判断,对于生成的结果或者输入的数据,也有合理性判断的机制,如数据和常规的比较起来是否过于悬殊,从而提供建议。
小龙虾误删数据库案例。B站上看到一个博主的真实情况,他当时就是跟小龙虾抱怨了一下,觉得自己的机器比较卡,结果他就自作主张把数据库删除了一半,这些都是非常恐怖的事情。决策的科学性和执行的可控性都是需要重点考虑的。
“重庆三峡学院85万元路由器采购事件”。2025年5月曝光重庆三峡学院学校采购“防火墙及DNS设备”,中标价格:约85万元,实际设备:一款普通路由器(型号 TL-R473G)市场价:约300元左右。投标公司 用假材料参与投标,直接拿普通路由器冒充专业设备,评审专家 没有核查型号,学校相关人员 未认真把关就确认结果,整个流程集体失效。商业数字员工公司会根据这个事件做针对性的梳理和判断,在规则上优化。针对 “形式合规,实质失效”,流程看起来完整,但没人真正负责。 信息不对称 + 专业缺失,评标专家甚至没核查设备型号。风险传导失效,中间有人发现异常,但:没人愿意“叫停流程”。会在规范 skills、形成制度性防范方法上构建新的tools和规则引擎。在安全和准确性上面的应用中,人类专家的参与是必须的,所以 HI + AI 共同治理这个社会才是一个最合理逻辑。
Open Claw 的确通过做事情解放了人类大量的工作,但是也有风险,在使用过程中,哪怕是纯粹个人应用也需要有一定的防范意识,而商业或者政务应用,建议还是使用商业化的数字员工!
Open Claw,不是一个工具。它是一个可以替你工作的数字助理。未来的差距,不在于谁会用AI,而在于谁拥有“更强的数字员工”。当然安全性要求严格的,还是使用商业软件公司提供的数字员工。
作者:李伟
夜雨聆风