乐于分享
好东西不私藏

OpenClaw 改写 Agent 结构:从 Skills 到 Tools,AI 智能体真正的分水岭来了

OpenClaw 改写 Agent 结构:从 Skills 到 Tools,AI 智能体真正的分水岭来了

很多人还在把 Agent 当成“会聊天、会调用几个插件”的升级版机器人,但 OpenClaw 最近这波变化,已经在悄悄把问题改写了。它从 Skills 往 Tools 转,不只是工程层的小修小补,而是在重新定义:一个 AI Agent / 智能体 到底该怎么被组织、被控制、被扩展,以及被真正拿来用。

01 先别急着把它理解成“插件升级”,OpenClaw 改的是 Agent 的骨架

如果只看字面,Skills 到 Tools 很容易被理解成一次命名更新,像是“插件”换了个更高级的说法。但 OpenClaw 官方文档写得很直接:它现在把 browsercanvasnodescron 作为“一流工具”暴露出来,并明确说这些工具正在取代旧的 openclaw- Skills*;更关键的一句是,这些工具是类型化的,不需要调用 shell,智能体应该直接依赖它们。这句话很短,但信息量很大。它其实在说,OpenClaw 不想再让 Agent 主要靠一层松散的说明文件去“学会怎么做事”,而是要把做事能力直接沉到系统层,变成可以被平台原生理解和治理的能力。

这件事为什么重要?因为过去很长一段时间里,很多 AI Agent 产品的扩展逻辑都很像“给聊天机器人外挂技能包”。今天装个搜索,明天装个日历,后天再接个飞书、钉钉或者企业微信,看起来生态很热闹,实际上底层结构并不稳定。模型知道“有这个能力”,但系统未必真正知道“这个能力该怎么被限制、被授权、被观测、被审计”。OpenClaw 现在往 Tools 走,本质上是在把 Agent 从“会用很多外接能力的 Chatbot”往“拥有原生操作接口的系统型智能体”推进。这个变化,不只是 OpenClaw 自己的产品演进,它很可能也是整个 Agent 赛道接下来要补的基础课。

如果非要打个不那么严肃但很形象的比方,旧的 Skills 更像你给一个聪明实习生写了一堆操作说明:遇到什么情况,去开什么软件,执行什么命令,怎么把结果带回来。Tools 则更像你直接给他发了工牌、门禁和工作台,而且每一项权限都是系统可见、可收、可放的。前者当然也能干活,但组织规模一大、任务链一长,问题就会出来。后者不一定更浪漫,却更像能真的跑起来的结构。

02 Skills 不是没用,而是它更像“教模型做事”,Tools 则是“让系统直接会做事”

要理解这次变化,先得看 OpenClaw 对 Skills 的定义。官方文档里说得很清楚,Skills 是一个兼容 AgentSkills 的文件夹体系,本质是用 SKILL.md 和一些辅助文件来“教智能体如何使用工具”。它支持内置、全局、本地和工作区级加载,也支持插件附带 Skills,还能通过 ClawHub 这个公共 Skills 注册表去搜索、安装、更新和同步。换句话说,Skills 并不是一个随便拼的说明页,它已经是一个相当完整的能力封装和分发生态。

但问题也恰恰在这里。Skills 的思路,天然更偏“知识注入”而不是“系统原生能力”。它的核心任务,是告诉模型:这里有一个能力,你该怎么调用它,前提条件是什么,需要什么环境变量、什么二进制、什么配置,甚至需要什么 slash commandOpenClaw 文档里还专门写了 Skills 的加载优先级、元数据门控、环境变量注入、二进制检测和沙箱注意事项,这已经说明了一个现实:Skills 很灵活,但它本身就是一层复杂度。

再看 ToolsOpenClaw 不只是把 browsercanvasnodescron 放进系统里,还给了非常明确的允许/拒绝机制、工具配置 profile、按 provider/model 缩减工具集、按 agent 覆盖工具能力、工具组简写,以及工具如何通过系统提示和结构化 schema 同时暴露给模型。简单说,Tools 不是“告诉模型这里有个工具”,而是“系统先把工具定义成正式对象,再决定哪些模型、哪些 agent、哪些场景可以碰它”。这两种产品思路,差别非常大。

所以我更愿意把两者的区别概括成一句话:Skills 是在教模型做事,Tools 是在让系统直接会做事。前者更像认知层扩展,后者更像执行层重构。前者是“说明书逻辑”,后者是“接口逻辑”。而一旦产品从说明书逻辑走向接口逻辑,很多事情都会跟着变:权限治理会更清晰,错误处理会更标准,审计边界会更明确,用户也更容易知道“这个 Agent 到底真的能干什么、不能干什么”。

03 OpenClaw 这一步,实际上是在把 Agent 从“技能市场”拉回“操作系统”

很多人喜欢把 Agent 的未来想象成“应用商店模式”:谁家有更多 Skills、更多插件、更多接入,谁就更强。这种想法不是全错,但它有个问题:它很容易把 Agent 想得太像移动互联网时代的 App,而忽略了 Agent 更深的一面,其实更接近一个“持续在线、持续感知、持续执行”的系统层角色。OpenClaw 首页对自己的定义本来就不是单纯聊天机器人,而是一个 self-hosted gateway,连接 WhatsAppTelegramDiscordiMessage 等聊天应用到 AI coding agents,同时提供浏览器控制台、配置和会话管理。会话文档也写得很直白:所有会话状态都由 Gateway 拥有,UI 客户端应该向 Gateway 查询,而不是自己读本地文件。这说明 OpenClaw 一开始就不是在做单点聊天产品,它是在做中间层,在做控制平面。

一旦把这个背景放进来,再看从 Skills 到 Tools 的变化,你会发现它不是偶然,而是顺着产品底层定位自然长出来的。一个把自己定义成 Gateway 和 Control UI 的系统,最后一定会越来越在意:能力是不是系统原生的,执行是不是可控的,工具是不是可被统一调度的,配置是不是能被中心化治理的。OpenClaw 的 Tools 文档里甚至专门写到,工具会通过两条并行通道暴露给模型:一条是系统提示里的文字说明,另一条是发给模型 API 的结构化函数定义。换句话说,模型既“看见工具”,也“看见调用规范”。这其实已经非常像操作系统对应用暴露 API 的方式了。

这也是我觉得很多人对 OpenClaw 的理解还停留在表层的地方。大家还在问它像不像 Manus,能不能接 Claude Code,和 GPT-4、MiniMax、智谱这些模型或产品生态怎么搭,当然这些问题都有流量,也有现实意义。但如果只停在“谁更像一个更强的 AI 助手”这个层面,就会低估 OpenClaw 真正在做的事。它不是单纯在往一个 Agent 上不断贴功能,而是在尝试把 Agent 的能力组织方式本身重新设计一遍。说得夸张一点,它关心的已经不是“让模型多会几招”,而是“让智能体真正拥有一套像样的工作台”。

04 为什么这件事会在现在发生?因为 Agent 终于走到“不能只靠 Prompt 撑着”的阶段了

过去一年,很多 Agent 产品都靠一个非常熟悉的思路快速长大:模型够强,Prompt 写细一点,再接几个外部能力,基本就能把 demo 跑起来。这个阶段当然有用,行业很多热闹也是这么来的。但问题是,Prompt 能解决“会不会做”,很难彻底解决“怎么稳定地做、受控地做、规模化地做”。当 Agent 只是做个小任务、跑个小工作流时,这套办法问题不大;可一旦它开始接入浏览器、会话、定时任务、节点、消息通道,甚至逐步走向企业协作和生产环境,原来那种“靠说明书+约定俗成”维持秩序的方式,就会越来越吃力。OpenClaw 现在把 browsernodescron 这些能力拉到系统级,某种程度上就是在承认这件事:Agent 的下一阶段,不能只靠 Prompt 撑着。

这也是为什么官方文档在 Skills 这边反复提安全,在 Tools 这边反复提 allow/denyprofileprovider 限制和 agent 级覆盖。因为一旦能力变真,风险也会变真。比如 Skills 文档明确提醒,第三方 Skills 应被视为不受信任代码;秘密会注入宿主机进程而不是沙箱;高风险工具应优先放进隔离环境。Tools 文档则进一步把能力边界做成正式配置,甚至连 group:runtimegroup:fsgroup:webgroup:automation 这种工具组都已经抽象好了。这些看上去像工程实现,实际上反映的是同一个趋势:Agent 正在从“聪明接口”变成“需要治理的系统”。

说得更直白一点,行业之前太习惯把 Agent 当成“会思考的软件”,现在才开始慢慢意识到,它其实更像“会思考、也会动手的半自动系统”。前者主要靠模型能力,后者就必须讲产品结构。OpenClaw 从 Skills 往 Tools 走,恰好就是这个转折点上的一个很典型的样本。它告诉大家:如果你真想让 Agent 不只是偶尔惊艳一下,而是长期在线、稳定工作,那你迟早要补上工具原生化、权限中心化、执行结构化这一课。

05 这不只是 OpenClaw 的事情,它其实解释了为什么很多 Agent 产品总有一种“很强,但不好托付”的感觉

很多人第一次用某些 AI Agent / 智能体 产品,都会有一种很微妙的感受:它看起来什么都能做,真的交给它做事时,却总差一点托付感。不是能力不够,而是结构不够。你知道它可以操作网页、读文件、写内容、连外部服务,但你未必知道它到底是通过什么机制在做这些事,权限边界在哪里,失败时怎么收口,能不能审计,能不能禁某一类动作,能不能针对不同模型给不同工具集。只要这些问题说不清,Agent 就很难真正从“能玩”进入“能用”。OpenClaw 现在补的,恰恰就是这一层。

从产品感知上说,Skills 更容易造繁荣,Tools 更容易造秩序。前者很容易长出一个热闹生态:大家不断发新 Skills,不断同步,不断接第三方能力,ClawHub 这种注册表也会让整个系统看起来特别有生命力。后者则没那么热闹,因为它做的是底层收敛,是把真正常用、关键、危险、需要被治理的能力收回平台原生层。热闹当然重要,但到了某个阶段,秩序会更重要。尤其是当 Agent 不再只是技术极客的玩具,而要走向更广泛的使用人群时,用户真正需要的不是“这里有一百种能力”,而是“我知道这五种能力是平台认真管过的”。

这也是我觉得 OpenClaw 这次变化最值得写的地方。它不是在否定 Skills,官方文档甚至还在继续维护 Skills 体系、插件附带 Skills 和 ClawHub 生态;真正的意思是,Skills 以后更像生态层、分发层、经验层,Tools 则越来越像基础设施层、权限层、执行层。一旦这个分层成立,产品结构就清楚了:什么该放在注册表里自由生长,什么该沉到平台里统一治理,什么该交给模型理解,什么该交给系统保证。这种分工,可能比单纯多加几个能力要重要得多。

06 更长远地看,OpenClaw 可能不是在“优化 Agent”,而是在给 Agent 补一套产品工程学

今天很多关于 Agent 的讨论,还停留在“模型够不够强”“调用链够不够长”“自动化够不够多”这些层面。但如果一个品类真想成熟,最后拼的往往不是最会炫技的 demo,而是最扎实的产品工程学。OpenClaw 的这次变化就很像这样:它不是在给行业再造一个更花哨的 Agent 叙事,而是在提醒大家,Agent 要想真进入日常使用,必须从“能力拼接”走向“能力编排”,从“提示词约束”走向“系统约束”。

这件事其实很像早年的软件发展史。最开始大家会为“能不能做出来”兴奋,后来才慢慢明白,“能不能稳定地交给别人用”才是更难的部分。OpenClaw 从 Skills 到 Tools,有点像把 Agent 世界里那层长期被忽略的“中间件意识”补了回来。它不再只问模型“你会不会”,也开始认真问系统“你管不管得住”。前者决定上限,后者决定下限;前者决定想象力,后者决定信任感。等行业再往前走一段,你大概率会发现,真正能留下来的 Agent 产品,不一定是最会做营销演示的那批,而是最早把这套产品工程学补齐的那批。

这也是为什么我会说,这篇文章真正要讨论的,不只是 OpenClaw,也不是单独的 Skills 或 Tools,而是一个更大的判断:Agent 赛道正在从“把能力加进去”转向“把结构搭起来”。当这个拐点到来之后,谁还停留在“插件越多越好”的思路里,谁就很可能会在下一阶段显得越来越重、越来越乱、越来越不可信。反过来,谁先把工具收回系统、把权限做成正式接口、把执行链条变成可治理对象,谁就更接近真正成熟的智能体产品。OpenClaw 这次并不算高调,但它传递出来的信号,可能比表面看上去要大得多。

【结尾】

 OpenClaw 从 Skills 走向 Tools,看起来像一次文档和架构层的调整,实际上是在给 Agent 补骨架。真正成熟的智能体,不会只靠模型聪明,也不会只靠生态热闹,它还得有一套能被系统接住、被平台治理、被用户信任的产品结构。等这层共识在行业里真正立住,Agent 才算从“会做事”走到了“能托付”。


⭐点赞、转发、在看一键三连⭐点亮星标,不错过 Hive 硅基秩序 每一篇关于 Agent 时代的关键信号

往期精选庹颖涛,公众号:Hive硅基秩序