
昨天刚升了 4.1,写了一篇说 /tasks出来之后,后台任务终于不再黑箱了。
结果今天一翻 release notes,发现更大的东西在后面。
OpenClaw 4.2 今天正式发了。最值得说的一件事,是这条:
Tasks/Task Flow: restore the core Task Flow substrate with managed-vs-mirrored sync modes, durable flow state/revision tracking, and openclaw flowsinspection/recovery primitives
还有这条:
Tasks/Task Flow: add managed child task spawning plus sticky cancel intent, so external orchestrators can stop scheduling immediately and let parent Task Flows settle to cancelledonce active child tasks finish.
把这三条放在一起,我的感觉是:OpenClaw 终于把"AI 干活"这件事,往"AI 可靠地干活"又推进了一大步。
多步骤自动化,为什么以前总是不靠谱
用过 AI 写自动化脚本的人,大概都踩过这个坑:
你让它做一件事,这件事需要分 5 步。它吭哧吭哧做完了前 3 步,第 4 步出错了。然后你问它"刚才做到哪了",它说"我再重新来一遍",然后把前 3 步又做了一遍——要么是忘了,要么是重跑比排查快。
这只是最浅的问题。再往深一层,你会发现 AI 自动化系统的毛病其实是一组结构性问题:
状态不持久。任务跑着跑着,断了电、重启了服务,跑了多久、做完了什么,全丢了。你只能从头再来。
子任务不可控。你让它"去查资料、然后写报告、然后发给我",它起了 3 个子任务。但你想中途取消,只取消写报告那步,保留查资料的结果——做不到。取消就是全取消,继续就是全部一起跑。
进度不透明。你在 Slack 或 Telegram 里发了一个长任务请求,它回了一句"我开始做了",然后就沉默了。5 分钟后你不知道它是还在跑、卡住了、还是已经挂了。
编排不可观测。你起了多个子 agent,它们之间有没有互相等、有没有死锁、当前的瓶颈在哪——你看不到,只有等超时了才知道出事了。
这些问题,在单步任务里不是问题。但在真实工作流里,它们会让你从"AI 帮我自动化"退回到"还是我自己盯着吧"。
OpenClaw 4.2 解决的,就是这组问题。
Task Flow:第一次,任务流有了"地基"
4.2 里最核心的新功能,是 Task Flow substrate 回来了。
这不是新概念——OpenClaw 历史上曾经有过 Task Flow,后来某个版本里被重构掉了。这次 4.2 把它恢复了,而且配了一套完整的配套能力。
1. 持久化状态和版本追踪
Flow 现在有了 durable state。任务流中途断电、重启、崩溃,下次恢复时不再从头开始。系统会从上一次 checkpoint 继续跑。
而且每个 Flow 都有 revision tracking。你能看到当前是第几次执行、这次跟上次有什么变化。这对调试来说意义很大——以前任务失败了你只能看日志猜,现在可以直接对比版本 diff。
2. Managed child task spawning
OpenClaw 现在支持一个"父 Flow"派生出"子 Task",而且子 Task 可以是 managed 模式——父 Flow 知道子 Task 在做什么,也能在子 Task 完成后自动收口。
更重要的:支持 sticky cancel intent。
什么叫 sticky cancel?就是你取消一个父 Flow,系统不会粗暴地把所有子 Task 一起 SIGKILL 了事,而是会先通知所有子 Task"我要停了",让它们把当前步骤做完或者优雅退出,然后才真正关掉。
这在生产环境里非常重要。你不可能每次取消都让子任务强制退出——有时候它们正在写文件、写数据库、发送通知,必须给它们机会收尾。
3. openclaw flowsinspection/recovery 工具
4.2 加了一套 CLI 检查和恢复工具:
openclaw flows listopenclaw flows status <flow-id>openclaw flows cancel <flow-id>openclaw flows recover <flow-id>
你可以看当前有哪些 Flow 在跑、每个 Flow 进展到哪一步、哪个失败了可以恢复、哪个可以安全取消。
这意味着什么?意味着你终于可以用命令行管住你的 AI 自动化了。
sessions_yield:编排器终于能主动交出控制权
另一个我一直在等的工具:
Agents/subagents: add sessions_yieldso orchestrators can end the current turn immediately, skip queued tool work, and carry a hidden follow-up payload into the next session turn.
用场景说:
你有一个编排 agent,它派出了 3 个子 agent 分别去搜资料、写草稿、发通知。搜资料的 agent 最先回来,写完了。编排 agent 这时候不需要等剩下两个,直接处理资料,然后继续自己的流程——但以前没有 sessions_yield,它只能等所有子 agent 都回来才能继续。
有了 sessions_yield,编排 agent 可以说:"我先把这份资料处理了,剩下的子 agent 回来时触发下一轮,我继续。"
这让真正的并行编排第一次变得自然。不是所有子 agent 全部完成后编排器才开始,而是每个子 agent 完成后都可以触发各自的处理流,编排器在每个节点主动决定下一步做什么。
为什么这些改动比新接一个模型更重要
过去一年,每次看 OpenClaw release notes,亮点都是"接了 GPT-5.4"、"接了 Claude Sonnet 4.6"、"支持 Gemini Flash"。
这些当然重要。但如果你认真用 OpenClaw 做日常自动化,你会发现真正卡住你的,往往不是"模型不够聪明",而是:
工作流中途断了怎么办 多个任务并行时怎么管状态 某个任务失败时怎么只回滚它而不影响其他 怎么知道当前系统里有多少任务在跑、跑到哪了
这些问题,模型能力帮不了你。模型只能决定"做得好不好",解决不了"做得稳不稳"。
4.2 的 Task Flow substrate,做的就是后半段的事。
它不是在让 OpenClaw 更聪明,而是在让它更可靠、更可观测、更可控。
exec 默认改成 YOLO 模式,这事值得注意
4.2 里有一条不太起眼但实际上挺重要的变更:
Exec defaults: make gateway/node host exec default to YOLO mode by requesting security=fullwithask=off
翻译一下:OpenClaw 现在把"host exec"的默认行为从"每次都要问"改成了"YOLO 模式"——不需要弹窗审批了。
这是一个挺大的安全默认值变更。
对于共享设备、多人使用的场景,这可能是需要注意的变化。如果你想在某些 agent 上保持审批要求,4.2 提供了明确的配置路径让你把 ask 改回来。
建议:看完 release notes 之后,顺手跑一下 openclaw doctor,看看有没有 exec 相关的配置警告。
Provider 路由重构:基础设施在变扎实
4.2 还有一批很大的基础设施变更,埋在 Fixes 里:
Provider transport policy 集中化:OpenAI、Anthropic、Copilot、图像生成的 HTTP 请求,现在全走同一套 auth/proxy/TLS 路径 OpenAI-compatible routing 集中化 Anthropic routing 集中化 媒体请求的 base URL 规范化、header 注入规范化
这些变更的共同点是:不是在加新功能,而是在消除技术债。
如果你自己写了自定义 provider 插件,或者在用 OpenAI-compatible 的私有模型端点,4.2 之后它们的行为会更符合预期。
升级建议
强烈建议升:
在用 cron 做多步骤自动化 有子 agent / 多 agent 编排场景 OpenClaw 接了飞书做文档协作 在用自定义 OpenAI-compatible provider
建议测试后升:
机器上 exec 审批策略依赖默认配置 Windows 环境在使用 OpenClaw exec
可以先观望:
只是本地偶尔对话,几乎不跑后台任务 4.1 刚装,还没来得及感受 /tasks
升级命令照旧:
openclaw update --yesopenclaw gateway restartopenclaw doctor
升完之后,建议跑一下这些:
# 检查 Task Flow 状态(如果有任务在跑的话)openclaw flows list# 检查 exec 策略有没有冲突openclaw doctor
我的判断
OpenClaw 4.2 是一个"把底层打扎实"的版本,不是一个"让 AI 更聪明"的版本。
但这恰恰是它最值钱的地方。
当一个 AI 工具还处于 demo 期,你只关心"它能不能做到"。
当它进入生产期,你关心的是"它能不能稳定地做到"、"做砸了能不能恢复"、"跑着的时候我能不能看得见"。
4.2 就是在回答后面这三个问题。
Task Flow substrate、child task cancel propagation、sessions_yield、persistent flow state、CLI 编排工具——这些东西单独拿出来,每一条都不炫酷。
但它们组合在一起,意义很清楚:
OpenClaw 在变成一个可以真正托付工作的系统,而不只是可以在你盯着的时候帮你做事的工具。
这个区别,就是 demo 和产品的区别。
你用 OpenClaw 跑多步骤自动化了吗?Task Flow 的 cancel propagation 和持久化状态,你有没有实际场景在用?评论区说说你的体验。
夜雨聆风