2026 年初,一个叫 OpenClaw 的开源项目在全球开发者社区引爆,短短3个月就收获了32万颗Star。


国内的反应比硅谷还快:腾讯一天官宣三款适配产品、楼下办安装活动近千人排队;阿里、百度、字节 48 小时内全线跟进一键部署;Kimi 成为官方主力模型后 20 天营收超过2025年全年。
Agent 能力,正在从少数团队的专项能力,变成任何人都能获得的基础设施。护城河的位置变了。
一
从辅助到自主:正在发生的范式切换
从 2023 年的对话式 AI 到 2025 年的早期 Agent 尝试,人始终是任务执行的主体,AI 在旁边辅助。2026 年初 OpenClaw的出现使得这个格局开始松动。

过去两年,以 Dify、n8n 为代表的工具主打的是一种“人工编排工作流”模式:开发者或业务人员预先画出流程图,明确每一步调用什么 API、判断条件是什么、异常走哪条分支,然后由系统(或嵌入的 AI 模型)按既定路径执行。这种模式在业务流程固定、分支可穷举的场景下非常成熟可靠,是对人工定义的流程进行自动化调度。
自主式 Agent 工具则走向另一条路线:用户只需给出一个目标(例如“清理这周邮件,把需要跟进的排进日历”),Agent 会自己拆解任务、选择合适的工具、动态调整执行路径,甚至根据中间结果修正下一步计划。整个过程没有预先画好的流程图,执行路径完全由上下文临时生成。这种模式能很好地应对那些无法提前穷举分支的开放任务。
Dify、n8n 这类工具没有被取代。流程固定、合规要求高的场景,自主式 Agent 反而不适合。执行路径不可预测,在强监管环境里是风险,不是优势。
两类工具往后会并存,适用的是不同的任务类型。
二
OpenClaw 是什么:架构与展望
OpenClaw是一个开源的自主式 Agent 框架,MIT 协议,由奥地利开发者 Peter Steinberger 于 2025 年 11 月创建(早期叫 Clawdbot,后因商标投诉改名 Moltbot,最后改为 OpenClaw)。2026 年 2 月,Steinberger 宣布加入 OpenAI,项目移交给独立开源基金会运营,MIT 协议和社区驱动模式不变。
OpenClaw 解决的核心问题是给 Agent 一个目标,它自己执行完,不需要人全程盯着,也不需要预定义流程。此外,内置了心跳调度器(Heartbeat)可以按设定间隔主动唤醒 Agent,让它在没有人类触发的情况下持续运行,比如定时检查收件箱、执行定时任务。
要让真正实现这个自主式 Agent,推理、任务调度、渠道交互不能耦合在一起。OpenClaw 的做法是把推理交给内嵌的 Pi Agent Runtime,自己负责渠道接入、任务编排、记忆管理和权限控制。
① Gateway:控制核心
Gateway 是 OpenClaw 的核心进程,常驻后台运行。渠道接入是它最基础的功能:WhatsApp、Telegram、Slack、Discord、Signal、iMessage、飞书、Microsoft Teams、Google Chat 等 20+ 主流平台开箱即用,新渠道也可以通过插件接入。但 Gateway 做的不只是收发消息,对话管理、Agent 调度、队列编排也在这一层完成。
② 持久化记忆:激进的工程选择
OpenClaw 没有用数据库。Agent 的对话历史、操作指令(AGENTS.md)、工具笔记(TOOLS.md)、用户画像(USER.md)等上下文,全部以 Markdown 和 YAML 文件存在本地磁盘。这个决定带来几个工程上的好处:
· 用 Git 就能版本控制 Agent 的记忆状态,出了问题可以回滚,还能 code review
· 零运维,不需要部署和维护数据库
· 从服务器到树莓派都能跑,跨平台没有兼容性问题
代价是大规模场景下检索性能有上限,目前用全文搜索加向量检索部分弥补,这是它还在演进的地方。
③ Lane 任务队列
多任务并发时,上下文互相干扰是 Agent 系统里最难调试的问题之一。OpenClaw 用「车道」来管理任务:同一个用户的会话内,消息严格按顺序处理;不同会话之间完全隔离;低风险任务可以显式放到独立车道并行跑。每条任务的执行路径清晰可追踪,出了问题知道去哪找。
④ 技能(Skill)生成
OpenClaw 的功能通过"Skill"扩展。社区已经积累了大量现成技能,覆盖常见场景,多数不需要从头开发。企业也可以开发私有技能对接内部系统,主版本升级时私有技能不受影响。ClawHub 是官方的技能注册中心,Agent 可以自动搜索和拉取需要的技能。截至 2026 年 3 月,社区已贡献超过 15,000 个技能,很多场景不需要从头开发。
对企业来说,这种以文件和自然语言为载体的技能格式,意味着不需要专门的开发团队也能定义和维护业务逻辑。
⑤ 安全机制与当前局限
OpenClaw 的“命令行执行工具”可以执行任意 shell 命令,且沙箱默认关闭,命令默认直接运行在宿主机上,拥有运行用户的全部权限。尽管框架提供了多层防护机制例如白名单审批和exec执行安全模式,但框架有防护并不等于默认安全。

当前另一个真实局限是稳定性。多步骤跨系统的复杂任务仍会出错,长任务中上下文容易被无关信息占满。因此, OpenClaw 现阶段更适合个人使用,安装在个人电脑上。 根据公司安全规定,不允许安装白名单之外的软件。
三
自主 Agent 在企业的典型落地路径
OpenClaw 的爆发,让自主 Agent 的概念广为人知,这种Agent模式真正进入企业生产环境。从当前社区实践与产业落地来看,其应用场景正沿着五条主线快速铺开:
一是面向企业内部的办公与运营自动化。从邮件处理、日程跟进、文档汇总到流程执行,把大量重复、跨系统的日常工作转为自主完成,成为最易落地、见效最快的方向。
二是面向技术团队的研发与运维提效。以自动化方式承担日志分析、环境巡检、部署辅助、脚本生成等工作,让研发与运维从机械性事务中解放,专注更具创造性的任务。
三是面向客户与市场的服务与营销自动化。在多渠道客服、用户触达、线索筛选、售后跟进等环节,实现从被动响应到主动服务的升级,在提升效率的同时保持服务一致性。
四是面向财务、人事、合规等高流程部门的确定性任务自动化。对账、凭证、简历初筛、合同初审等标准化工作,可通过 Skill 模块化落地,在强合规前提下大幅降低人工成本。
五是面向业务一线的供应链、电商与行业垂直场景深化。从库存、价格、订单的实时调度,到金融投研、工业监控、科研数据处理,自主智能体正在把行业专家经验转化为可复用、可规模化的智能能力。
这五条主线共同指向一个趋势:Agent 正在从“可选工具”变成“企业基础设施”。
执行层的自动化会越来越普及,而真正决定价值的,是企业能否在人机协同中守住自己的核心判断与决策能力。
四
自主智能体的注意事项
Agent 接管执行之后,有几件事容易被忽略。
一是可观测性。以前每个步骤都经过人的审核,现在中间环节由 Agent 自主完成。它做了什么、为什么这么做、哪里出了问题,在没有完善追踪机制的情况下很难回溯。多数 Agent 系统在这方面还欠着账,这是需要补足的。
二是责任归属。Agent 自动拒绝了一笔退款,谁来处理客户投诉?自动发出的邮件措辞有问题,算谁的失误?这些不是将来会面对的问题,已经有团队在处理了。关键决策链路上的人工确认节点,需要在设计阶段就定下来。
定义问题的能力,才是无法替代的核心。
Agent 能执行、能生成、能优化,但它需要有人告诉它做什么。而"该做什么"就是业务判断。当执行越来越多地外包出去,对「该做什么、该改什么」的感觉会慢慢变钝。

· 把 Agent 的输出当草稿来审,而不是直接当结论用
· 核心业务环节保持亲手参与,不要把理解过程也一起外包了
· 关键决策节点明确由谁确认,责任归属提前说清楚
过去只有资源充足的组织才能拥有的 Agent 能力,正在向每个人扩散。
去年建立的 Agent 实践是领先,但不是护城河。真正的护城河是在 Agent 大量运行之后,还能持续做那些 Agent 做不了的事:判断该做什么、评估做得够不够好。
模型能力的差距会越来越小,但知道该问什么问题,这件事没有捷径。
五
JoyClaw:企业内部安全可控的 OpenClaw
如果说 OpenClaw 让大家看到了自主式 Agent 的能力上限,那么宝马(南京)信息技术有限公司自研AI Agent工具JoyClaw 更重要的价值,是在于把这类能力带进企业内部时,补上“可控”这件事。
很多企业不是不想用 Agent,而是不敢直接把一个默认开放、执行路径高度动态的 Agent 系统接进真实业务。问题不在于它能不能做,而在于它出了问题谁知道、越界了谁拦、接了内部系统之后谁来治理。
JoyClaw 的定位,不是简单复刻一个更自由的 OpenClaw,而是把自主式 Agent 的执行能力,收敛进企业可以理解、可以审批、可以运维的控制边界里。它保留了 Agent 自主拆解任务、调用工具、持续执行的能力,同时把企业真正关心的几件事前置出来:
① 执行边界清晰
一次任务是在本机执行,还是在沙箱里执行;能访问哪些工具、哪些目录、哪些运行时;是否启用了记忆、是否启用了安全策略,JoyClaw 不是把这些能力藏在底层,而是逐步把它们组织成可见、可解释的控制面。
②权限与风险可控
自主式 Agent 的价值在于会自己做事,但企业环境里,高风险动作不能靠默认放行。JoyClaw 把权限审批、工具策略、风险拦截、Guardrails 作为系统能力来建设,目的是让 Agent 在继续向前执行之前,先经过组织认可的边界判断。这样企业得到的不是一个“什么都敢做”的 Agent,而是一个“知道什么时候该停、什么时候该问、什么时候该受限”的 Agent。
③企业环境更容易接入
真正落地时,Agent 很少只服务一个聊天窗口,它要进入企业已有的软件、账号体系和沟通链路。JoyClaw 以桌面工作台为核心,围绕多通道接入、技能扩展、定时任务和内部系统对接,形成了一套更适合企业内部使用的集成方式。它不是只展示一个模型回答得多聪明,而是让 Agent 能在企业现有环境中稳定协作。
④自主能力与治理能力并重
OpenClaw 代表的是 Agent 的自由度,而 JoyClaw 想解决的是企业使用 Agent 时最现实的矛盾:越自主,越需要治理;越接近真实业务,越需要可追踪、可解释、可维护。JoyClaw 的价值,正是在这条线上找到平衡点,让 Agent 不只“能跑起来”,还能“放心跑进去”。
所以,如果说 OpenClaw 展示的是下一代 Agent 的方向,那么 JoyClaw 更像是这条路线进入企业后的落地版本:它不是把执行权完全交给 Agent,而是把 Agent 纳入企业自己的执行边界、审批机制和治理体系中。
“OpenClaw 让 Agent 更自主,JoyClaw 让 Agent 真正进入企业。”
夜雨聆风