很多人一遇到 OpenClaw 跑不稳,第一反应就是继续改配置、加规则、换链路。但如果你现在的状态是“偶尔能跑一次,连续跑几天就开始掉链子”,那大概率不是配置还不够,而是最基础的运行件没补齐。
真正让 OpenClaw 长期不稳的,通常不是某个参数没调对,而是你根本说不清:任务从哪进、失败去哪看、出错后怎么补跑、哪些地方必须停下来等人拍板。基础件一旦是空的,你越往上叠自动化,系统越像在碰运气。
这篇我只解决一个问题:怎么把 OpenClaw 从“偶尔能跑”拉回到“出了问题也知道下一步做什么”。 你不用先学更复杂的配置,先把下面这 5 个基础件补齐就够了。

先别误判:你以为是配置问题,很多时候其实是运行问题
最常见的误判是:
“它不稳,说明我还要继续调配置。”
但更接近真实的判断通常是:
“它不稳,是因为我现在这套流程还不具备可看、可控、可复跑的基础。”
这两种判断,看起来只差一点,后面的动作会完全不同。
如果你按“配置不够”去处理,就会不断加参数、补 prompt、改脚本,结果是某次可能跑通了,但一到连续运行、换人接手、失败重来,系统还是会散。
如果你按“基础件没补齐”去处理,你会先补入口、命名、观测、补跑、停点。这样做不一定让它今天立刻变强,但会让它开始真正稳定。
先看总判断:稳不稳,不看它成功过几次
我现在判断一套 OpenClaw 稳不稳,不先看它有没有成功跑出结果,而先看这一件事:
同一个任务失败时,你能不能很快知道它卡在哪、该不该补跑、补跑后怎么接回原流程。
如果这件事做不到,那它就还不算稳定。哪怕它前几次跑成了,也只是暂时没出事。
下面这 5 个基础件,就是我会先检查的顺序。
1. 固定入口:不要让任务从好几个地方随便进
先做什么
先把任务入口收敛成 1 个主入口。至少要明确三件事:
- • 任务从哪里进来
- • 由谁认领
- • 最终走哪一条正式执行路径
你可以是任务卡、固定目录、统一脚本入口,形式不重要,唯一主入口最重要。
别做什么
- • 一会儿手动跑,一会儿 cron 跑,一会儿又临时改脚本直接跑
- • 同一个任务保留多个入口版本
- • 把“今天能启动”当成“入口已经稳定”
怎么判断做对没
随便拿一个最近最常跑的任务,你能不能马上答出这 3 个问题:
- 1. 它从哪里进
- 2. 它由谁接
- 3. 它最后在哪条路径执行
如果这里都说不清,后面排障只会越来越乱。
2. 命名可追踪:不要让日志、文件、任务本体对不上
先做什么
给每个任务一个最小可回查标识,至少带上:
- • 日期
- • 任务主题
- • 执行对象或渠道
文件名、任务卡标题、执行记录,最好一眼就能互相对上。
别做什么
- • 到处都是
test、new、final2、retry - • 正文一个名字,日志里又是另一个名字
- • 每次重跑都重新起一套命名,最后谁也对不上谁
怎么判断做对没
看到一条失败记录时,你能不能在 30 秒内找到:
- • 对应的是哪次任务
- • 原文件在哪
- • 这次是不是重跑版本
如果找不到,说明它还不能算真正可维护。
3. 结果有固定位置:不要靠感觉判断有没有跑完
先做什么
给每次执行留一个固定结果位,至少能看出:
- • 有没有开始
- • 卡在哪一步
- • 最后是成功还是失败
这个位置可以是日志文件、状态目录、固定输出记录,形式不重要,固定最重要。
别做什么
- • 只看“终端刚才好像没报错”
- • 靠聊天记录回忆上次跑到了哪
- • 错误输出散在多个地方
怎么判断做对没
以后再遇到“今天怎么没动静”,你不用重新猜,直接去固定位置就能判断:
- • 是没触发
- • 是触发后失败
- • 还是跑完了但结果没接住
很多人以为自己在排配置,其实是在补最基本的观测位。
4. 失败后能补跑:不要每次出错都从头手搓
先做什么
提前定一条最小补跑规则:
- • 哪类错误可以直接重跑
- • 哪类错误必须先人工确认
- • 补跑后结果写回哪里
不用一开始就做复杂,但至少失败后下一步是什么,要提前写清楚。
别做什么
- • 每次失败都现场想办法
- • 把“再跑一次试试”当成正式方案
- • 补跑成功了却不留记录,下次继续重复踩坑
怎么判断做对没
同一个任务失败一次后,换另一个人来处理,也能按规则补跑,而不是非得等你口头解释。
做到这里,OpenClaw 才开始从“个人手感驱动”变成“流程可复用”。
5. 人工停点明确:不要让系统在不该自动的时候继续往前跑
先做什么
把必须人工确认的节点提前写清楚,比如:
- • 是否正式发布
- • 是否覆盖旧内容
- • 是否对外发送
- • 是否进入下一阶段任务
别做什么
- • 把“理论上能自动”直接等同于“现在就该自动”
- • 把高风险动作藏进长链路里一次跑完
- • 让系统在关键节点默认继续执行
怎么判断做对没
看一条完整流程时,你能明确指出:
- • 哪几步可以自动
- • 哪一步必须停下来等人拍板
如果这件事说不清,长期不稳几乎是必然的。很多事故不是不会跑,而是跑过了头。

这 5 个基础件,串起来就是一条最小运行闭环
你不用一次做很大,按这个顺序补就行:
- 1. 先收入口:保证任务只从一个主入口进
- 2. 再统一命名:让任务、日志、输出彼此对得上
- 3. 再补观测位:失败时能快速看到卡点
- 4. 再定补跑规则:失败后知道怎么接回去
- 5. 最后设人工停点:把高风险动作卡在人来拍板的位置
你会发现,很多“不稳”不是技术能力不够,而是少了这条闭环。
闭环一旦补上,哪怕还不完美,系统也会先从“偶尔能跑”变成“出了问题知道怎么处理”。这一步,比继续堆配置更重要。
如果你现在只做 1 件事,就先做这个
今天先别扩新任务,也别继续追求更高自动化。
你就挑一个最近最常跑的任务,按上面这 5 项过一遍。只要其中有 2 项以上你现在答不上来,就先补基础件,不要急着往前推。
如果这篇对你有启发,欢迎关注。
回复 「OpenClaw」,获取一份 OpenClaw 入门资料。
夜雨聆风