从 OpenClaw 现象看 AI 的＂执行力＂革命

2026 年初，一个叫 OpenClaw 的开源项目在全球开发者社区引爆，短短3个月就收获了32万颗Star。

国内的反应比硅谷还快：腾讯一天官宣三款适配产品、楼下办安装活动近千人排队；阿里、百度、字节 48 小时内全线跟进一键部署；Kimi 成为官方主力模型后 20 天营收超过2025年全年。

Agent 能力，正在从少数团队的专项能力，变成任何人都能获得的基础设施。护城河的位置变了。

一

从辅助到自主：正在发生的范式切换

从 2023 年的对话式 AI 到 2025 年的早期 Agent 尝试，人始终是任务执行的主体，AI 在旁边辅助。2026 年初 OpenClaw的出现使得这个格局开始松动。

过去两年，以 Dify、n8n 为代表的工具主打的是一种“人工编排工作流”模式：开发者或业务人员预先画出流程图，明确每一步调用什么 API、判断条件是什么、异常走哪条分支，然后由系统（或嵌入的 AI 模型）按既定路径执行。这种模式在业务流程固定、分支可穷举的场景下非常成熟可靠，是对人工定义的流程进行自动化调度。

自主式 Agent 工具则走向另一条路线：用户只需给出一个目标（例如“清理这周邮件，把需要跟进的排进日历”），Agent 会自己拆解任务、选择合适的工具、动态调整执行路径，甚至根据中间结果修正下一步计划。整个过程没有预先画好的流程图，执行路径完全由上下文临时生成。这种模式能很好地应对那些无法提前穷举分支的开放任务。

Dify、n8n 这类工具没有被取代。流程固定、合规要求高的场景，自主式 Agent 反而不适合。执行路径不可预测，在强监管环境里是风险，不是优势。

两类工具往后会并存，适用的是不同的任务类型。

二

OpenClaw 是什么：架构与展望

OpenClaw是一个开源的自主式 Agent 框架，MIT 协议，由奥地利开发者 Peter Steinberger 于 2025 年 11 月创建（早期叫 Clawdbot，后因商标投诉改名 Moltbot，最后改为 OpenClaw）。2026 年 2 月，Steinberger 宣布加入 OpenAI，项目移交给独立开源基金会运营，MIT 协议和社区驱动模式不变。

OpenClaw 解决的核心问题是给 Agent 一个目标，它自己执行完，不需要人全程盯着，也不需要预定义流程。此外，内置了心跳调度器（Heartbeat）可以按设定间隔主动唤醒 Agent，让它在没有人类触发的情况下持续运行，比如定时检查收件箱、执行定时任务。

要让真正实现这个自主式 Agent，推理、任务调度、渠道交互不能耦合在一起。OpenClaw 的做法是把推理交给内嵌的 Pi Agent Runtime，自己负责渠道接入、任务编排、记忆管理和权限控制。

① Gateway：控制核心

Gateway 是 OpenClaw 的核心进程，常驻后台运行。渠道接入是它最基础的功能：WhatsApp、Telegram、Slack、Discord、Signal、iMessage、飞书、Microsoft Teams、Google Chat 等 20+ 主流平台开箱即用，新渠道也可以通过插件接入。但 Gateway 做的不只是收发消息，对话管理、Agent 调度、队列编排也在这一层完成。

② 持久化记忆：激进的工程选择

OpenClaw 没有用数据库。Agent 的对话历史、操作指令（AGENTS.md）、工具笔记（TOOLS.md）、用户画像（USER.md）等上下文，全部以 Markdown 和 YAML 文件存在本地磁盘。这个决定带来几个工程上的好处：

· 用 Git 就能版本控制 Agent 的记忆状态，出了问题可以回滚，还能 code review

· 零运维，不需要部署和维护数据库

· 从服务器到树莓派都能跑，跨平台没有兼容性问题

代价是大规模场景下检索性能有上限，目前用全文搜索加向量检索部分弥补，这是它还在演进的地方。

③ Lane 任务队列

多任务并发时，上下文互相干扰是 Agent 系统里最难调试的问题之一。OpenClaw 用「车道」来管理任务：同一个用户的会话内，消息严格按顺序处理；不同会话之间完全隔离；低风险任务可以显式放到独立车道并行跑。每条任务的执行路径清晰可追踪，出了问题知道去哪找。

④ 技能(Skill)生成

OpenClaw 的功能通过"Skill"扩展。社区已经积累了大量现成技能，覆盖常见场景，多数不需要从头开发。企业也可以开发私有技能对接内部系统，主版本升级时私有技能不受影响。ClawHub 是官方的技能注册中心，Agent 可以自动搜索和拉取需要的技能。截至 2026 年 3 月，社区已贡献超过 15,000 个技能，很多场景不需要从头开发。

对企业来说，这种以文件和自然语言为载体的技能格式，意味着不需要专门的开发团队也能定义和维护业务逻辑。

⑤ 安全机制与当前局限

OpenClaw 的“命令行执行工具”可以执行任意 shell 命令，且沙箱默认关闭，命令默认直接运行在宿主机上，拥有运行用户的全部权限。尽管框架提供了多层防护机制例如白名单审批和exec执行安全模式，但框架有防护并不等于默认安全。

当前另一个真实局限是稳定性。多步骤跨系统的复杂任务仍会出错，长任务中上下文容易被无关信息占满。因此， OpenClaw 现阶段更适合个人使用，安装在个人电脑上。 根据公司安全规定，不允许安装白名单之外的软件。

三

自主 Agent 在企业的典型落地路径

OpenClaw 的爆发，让自主 Agent 的概念广为人知，这种Agent模式真正进入企业生产环境。从当前社区实践与产业落地来看，其应用场景正沿着五条主线快速铺开：

一是面向企业内部的办公与运营自动化。从邮件处理、日程跟进、文档汇总到流程执行，把大量重复、跨系统的日常工作转为自主完成，成为最易落地、见效最快的方向。

二是面向技术团队的研发与运维提效。以自动化方式承担日志分析、环境巡检、部署辅助、脚本生成等工作，让研发与运维从机械性事务中解放，专注更具创造性的任务。

三是面向客户与市场的服务与营销自动化。在多渠道客服、用户触达、线索筛选、售后跟进等环节，实现从被动响应到主动服务的升级，在提升效率的同时保持服务一致性。

四是面向财务、人事、合规等高流程部门的确定性任务自动化。对账、凭证、简历初筛、合同初审等标准化工作，可通过 Skill 模块化落地，在强合规前提下大幅降低人工成本。

五是面向业务一线的供应链、电商与行业垂直场景深化。从库存、价格、订单的实时调度，到金融投研、工业监控、科研数据处理，自主智能体正在把行业专家经验转化为可复用、可规模化的智能能力。

这五条主线共同指向一个趋势：Agent 正在从“可选工具”变成“企业基础设施”。

执行层的自动化会越来越普及，而真正决定价值的，是企业能否在人机协同中守住自己的核心判断与决策能力。

四

自主智能体的注意事项

Agent 接管执行之后，有几件事容易被忽略。

一是可观测性。以前每个步骤都经过人的审核，现在中间环节由 Agent 自主完成。它做了什么、为什么这么做、哪里出了问题，在没有完善追踪机制的情况下很难回溯。多数 Agent 系统在这方面还欠着账，这是需要补足的。

二是责任归属。Agent 自动拒绝了一笔退款，谁来处理客户投诉？自动发出的邮件措辞有问题，算谁的失误？这些不是将来会面对的问题，已经有团队在处理了。关键决策链路上的人工确认节点，需要在设计阶段就定下来。

定义问题的能力，才是无法替代的核心。

Agent 能执行、能生成、能优化，但它需要有人告诉它做什么。而"该做什么"就是业务判断。当执行越来越多地外包出去，对「该做什么、该改什么」的感觉会慢慢变钝。

· 把 Agent 的输出当草稿来审，而不是直接当结论用

· 核心业务环节保持亲手参与，不要把理解过程也一起外包了

· 关键决策节点明确由谁确认，责任归属提前说清楚

过去只有资源充足的组织才能拥有的 Agent 能力，正在向每个人扩散。

去年建立的 Agent 实践是领先，但不是护城河。真正的护城河是在 Agent 大量运行之后，还能持续做那些 Agent 做不了的事：判断该做什么、评估做得够不够好。

模型能力的差距会越来越小，但知道该问什么问题，这件事没有捷径。

五

JoyClaw：企业内部安全可控的 OpenClaw

如果说 OpenClaw 让大家看到了自主式 Agent 的能力上限，那么宝马（南京）信息技术有限公司自研AI Agent工具JoyClaw 更重要的价值，是在于把这类能力带进企业内部时，补上“可控”这件事。

很多企业不是不想用 Agent，而是不敢直接把一个默认开放、执行路径高度动态的 Agent 系统接进真实业务。问题不在于它能不能做，而在于它出了问题谁知道、越界了谁拦、接了内部系统之后谁来治理。

JoyClaw 的定位，不是简单复刻一个更自由的 OpenClaw，而是把自主式 Agent 的执行能力，收敛进企业可以理解、可以审批、可以运维的控制边界里。它保留了 Agent 自主拆解任务、调用工具、持续执行的能力，同时把企业真正关心的几件事前置出来：

① 执行边界清晰

一次任务是在本机执行，还是在沙箱里执行；能访问哪些工具、哪些目录、哪些运行时；是否启用了记忆、是否启用了安全策略，JoyClaw 不是把这些能力藏在底层，而是逐步把它们组织成可见、可解释的控制面。

②权限与风险可控

自主式 Agent 的价值在于会自己做事，但企业环境里，高风险动作不能靠默认放行。JoyClaw 把权限审批、工具策略、风险拦截、Guardrails 作为系统能力来建设，目的是让 Agent 在继续向前执行之前，先经过组织认可的边界判断。这样企业得到的不是一个“什么都敢做”的 Agent，而是一个“知道什么时候该停、什么时候该问、什么时候该受限”的 Agent。

③企业环境更容易接入

真正落地时，Agent 很少只服务一个聊天窗口，它要进入企业已有的软件、账号体系和沟通链路。JoyClaw 以桌面工作台为核心，围绕多通道接入、技能扩展、定时任务和内部系统对接，形成了一套更适合企业内部使用的集成方式。它不是只展示一个模型回答得多聪明，而是让 Agent 能在企业现有环境中稳定协作。

④自主能力与治理能力并重

OpenClaw 代表的是 Agent 的自由度，而 JoyClaw 想解决的是企业使用 Agent 时最现实的矛盾：越自主，越需要治理；越接近真实业务，越需要可追踪、可解释、可维护。JoyClaw 的价值，正是在这条线上找到平衡点，让 Agent 不只“能跑起来”，还能“放心跑进去”。

所以，如果说 OpenClaw 展示的是下一代 Agent 的方向，那么 JoyClaw 更像是这条路线进入企业后的落地版本：它不是把执行权完全交给 Agent，而是把 Agent 纳入企业自己的执行边界、审批机制和治理体系中。

“OpenClaw 让 Agent 更自主，JoyClaw 让 Agent 真正进入企业。”