OpenClaw(小龙虾)爆火,核心是从“聊天AI”变成“能动手的AI执行体”。
简单来说,就是从“嘴替”到“手替”。以前AI说“你可以这样做”;现在AI说“我帮你做完了”。
• 传统AI:只给文字/方案,不能直接操作电脑/软件,你得自己一步步做。
• OpenClaw:自主执行闭环(理解→规划→操作→反馈),直接操控电脑。
那为什么openclaw能做到手替?还是对应到《计算机是怎么样跑起来》第三条原则:计算机的处理方式,和人的思维习惯不一样。
比如“整理Excel”:
1. 输入:你一句话
2. 运算:AI不仅想步骤,还把步骤拆成鼠标点哪、键盘按啥、点几下
3. 输出:直接给电脑发操作指令,电脑自己执行
这就是第三条原则的核心用法:
• 人是:看一眼 → 懂了 → 动手
• 电脑是:听不懂人话,只会执行死指令
OpenClaw把人话翻译成指令,靠的是五步翻译流水线:听懂意图→拆成步骤→选工具→发指令→执行反馈,每一步都按电脑逻辑来,让“人话”变“电脑能懂的死命令”。
下面用更通俗的“团队分工”比喻,理解更轻松:
🧠 大脑:LLM大模型(核心决策者)
• 主要工作:把人话翻译成“电脑能懂的执行计划”,包括:
1. 理解你的真实意图(比如“弄下表格”→“整理D盘Excel文件并归档”)
2. 拆成最小可执行步骤(打开管理器→导航→筛选→排序→归档)
3. 决定用哪些工具(技能)完成每一步
• 一句话定位:大模型是“总指挥”,负责“想清楚怎么干”,但不直接动手
🛠️ 手:Skill技能库(具体执行者)
• 主要工作:按计划“动手干活”,每类Skill对应一种能力:
◦ FileSystemSkill:文件读写、重命名、移动(管电脑文件)
◦ BrowserSkill:浏览器打开、点击、输入(上网操作)
◦ ExcelSkill:表格数据整理、公式计算(处理Excel)
◦ FeishuSkill:飞书消息、文档、审批操作(对接飞书)
• 特点:技能是模块化插件,可从ClawHub一键安装,也能自己开发,越用越强
• 一句话定位:Skill是“工人”,负责“按指令干具体活”,只听指挥不思考
📥 输入界面:企微/飞书/微信等渠道(沟通窗口)
• 主要工作:你和AI的“聊天窗口”,负责:
1. 接收你的自然语言指令(文字/语音)
2. 把指令传给“大脑”(大模型)
3. 把执行进度/结果反馈给你(比如“已找到12个Excel文件,正在排序...”)
• 不只是输入:渠道还支持输出反馈和多轮交互(比如AI问你“文件放哪个文件夹?”)
• 一句话定位:渠道是“前台接待”,负责“传递信息、反馈进展”,不参与决策和执行
⚙️ 隐藏的“神经中枢”:Gateway网关(团队协调员)
别漏了Gateway,它是OpenClaw的“核心调度中心”,相当于:
• 任务分配员:把大模型的执行计划,按步骤分给对应的Skill执行
• 进度跟踪员:实时监控每一步执行状态,记录成功/失败
• 异常处理员:执行出错时(比如文件找不到),让大模型重新规划
• 记忆保管员:存储对话历史、执行记录,让AI“越用越懂你”
• 一句话定位:Gateway是“项目经理”,负责“协调大脑和手,确保任务顺利完成”。
所以OpenClaw就像一个“AI小公司”,你通过前台(渠道)提需求,总指挥(大模型)做计划,项目经理(Gateway)协调,工人(Skill)动手干活,最后前台把结果反馈给你——全程自动化,不用你操心中间环节。
这样一剖析,openclaw没有那么神秘,但又挺厉害的。
夜雨聆风