乐于分享
好东西不私藏

折腾 OpenClaw 三个月后,我把它卸载了

折腾 OpenClaw 三个月后,我把它卸载了

从 Clawdbot 入局,到现在的 OpenClaw,三个月后,我选择把 OpenClaw 卸载了。
这不是我第一次卸载 OpenClaw,但确实是最后一次(毕竟中间删除又安装折腾过好几次,云端、本地也是各种折腾了好几次)
过去的 3 月、4 月,每天大部分的时间和精力都消耗在 OpenClaw 的维护上。定时任务、Skill 执行,没有一个是能在无人值守的情况下顺利完成的,太累了。
正好五一放假,先休息几天,慎重考虑一下是否值得。
然后我就卸载了。
我留下了几个放在 Dropbox 里的人设和规则文件,算是给这几个月留一点痕迹(调教出一个人设不容易)。其他所有 Skill、聊天记录啥的,能清的都清掉,所有文件和设置也都进行清理,尽量还原到没有安装过 OpenClaw 的状态。
——终于不用在每天修理 OpenClaw 的日常中生活了哈哈哈。
故事的一开始,还是从一个美好的想法开始。
1 月底的一天,我在 X 上面随意逛着看 AI 新闻,刷到几个 OpenClaw 的传播案例。当时还没太当回事,就当看几个营销号乐呵乐呵。
后来又刷小红书,看到有人在推这个新的个人助理,说它是 7 * 24 小时不间断的电脑牛马,可以控制你电脑的所有权限。案例都是 OpenClaw 自己找工具、自己跑流程、自己完成现实世界里的任务。给人的感觉很是不错:这不是一个只会聊天的 AI,它好像真的能把一个任务接过去,然后自己往前推进。
当时自己用 Claude Code 有一段时间了,Claude cowork 功能刚开始发布(只有 Claude 的客户端才能用,我没有付费也就没法体验),我觉感觉好像还缺了点什么。
刷到小红书的笔记后不久,再看看 X 上面的新闻,我才想到 Claude cowork 缺了啥。
缺了一个通信通道,一个我们可以随时指挥它的联系方式,而不是必须把我们“按”在电脑面前。
后来我才发现,这只是一个误判。
Telegram、Discord、飞书、企业微信,看起来像是把 AI 从电脑里放了出来,像一个随时可以叫到的人。
通信通道解决的只是“我怎么找到它”。
它没有自动解决“它怎么理解任务、怎么连续执行、怎么知道自己错了、错了以后怎么恢复”。
我当时上头的地方就在这里。
我以为把 AI 接到更多地方,它就离真实工作流更近了。后来才发现,它只是满足我们24小时不断 “Work” 的假象而已。。
那段时间我准备招人,所以看到这些内容的时候,脑子里冒出来的一个想法特别具体:
如果我能安装一个这样的 Agent,让它根据我的要求去招聘网站发 JD,有简历了自动筛选,然后合适的自己约电话面试;到了时间自己装个 TTS 自己去帮我面试,然后给我报告决定要不要发 Offer,这样就完美了。
——自己想办法把自己干掉了属于是。哈哈哈哈哈哈哈。
招聘只是我当时脑子里第一个冒出来的例子。后面还有写文章、筛选信息、定时发日报、处理后台发布,甚至帮我盯着一些重复性工作。
我想看看这个产品能不能做到吹牛的这种程度。
于是,我在 Claude Code 的帮助下安装好了第一版,配置到了 Telegram 上,先用的是智谱(为此还当了一回智谱的合伙人,上市的易拉罐也有我的一份哈哈哈)
然后第二天就开始不对劲。
提问没有反馈,要么就是没法调用,后面直接来个 API 余额不足。我去智谱后台一看,好家伙,已经用了 98% 的量(全是调用工具造成的)。
那会儿其实也没觉得这个工具不行。
当时的想法是,刚开始用,而且这个产品本身还是开源的,折腾一下也很正常。
转眼就快过年了,工作上的事儿也多,就这样边折腾边等过年,慢慢养着呗。
春节期间,半个月基本没碰。
节后回来,不知道为什么,OpenClaw 突然就火了。各个公司开始宣传自家的龙虾,微信群里,到处都是讨论龙虾的人。小红书上,公众号里,都是各种小龙虾的攻略,热闹得不行。
那时候我还在折腾通道和定时任务。
通道一开始选的是 Telegram,但这个工具在国内使用还是不太方便,后来我就迁移到了飞书上。
飞书这块我折腾了很久。机器人怎么配置,走 WebSocket 长连接还是 Webhook(我之前一直记成 welook,后来才发现是自己记错了),权限怎么开,消息怎么回,都是问题。
而且飞书刚开始用起来有个特别难受的地方:你发一个消息,只能等 AI 回复。中间它到底有没有正常运行,是不是卡住了,是不是在调用工具,完全靠猜(后来好像开始支持流式输出了,体验才稍微好一点;不过那时候我又已经迁移到 Discord 和企业微信了哈哈哈哈)
通道差不多了以后,我就开始折腾多 Agent 模式和定时任务。
我让 OpenClaw 创建了 9 个子 Agent,每个 Agent 都对应一个飞书机器人,还给它配置了头像、昵称和完整的人设(我用 Gemini 按照虚拟公司的操作,给每个 Agent 都设定了完整的用户画像,包括姓名、职业、行为习惯、社交关系等)。期间我也折腾了好多 Skill,还一度设想把 Skill 拆成不同的环节(原子化),让不同的 Agent 有不同的 Skill 和上下文,想让它们以虚拟公司的模式运行。
结果,没跑起来哈哈哈哈哈哈(飞书不支持机器人相互 @)
后来才知道,飞书有自己的限制。一个是消息数,当时一个月好像只有 18000 的量(后面才放开或者优惠,这个时间点我有点记不清);另一个是多个 Agent 不能互相 @,也就没法实现我想象中那种团队协作。
于是我又迁移到了 Discord,据说可以多 Agent 相互 @,能实现我的理想。
Discord 的频道和论坛模型,看起来确实更适合这种任务。OpenClaw 自己创建子频道,自己在里面发帖,这个反而跑得不错。
我当时想法很美好:每天早上 9 点,自动发 AI 日报到 Discord 的文字论坛里。
这个任务我本来觉得不算离谱。信息源规定好了,输出的模板也有现成的,OpenClaw 也测试过在频道里发帖和回复。理论上,它每天到点跑一下,把当天 AI 相关的信息整理出来,再照猫画虎按格式发到论坛里就行。
结果第二天一看,什么都没有。一看后台,一堆报错日志。
我手动让它重新跑,问题又换了一种形式出现:信息源开始幻觉,明明限定过来源,它还是会自己编;好不容易把来源问题压下去,发帖又不按规定格式来;格式刚修完,通道又断了。
前后改了好几次,每一次都像是快好了,但没有一次真正顺畅跑完。
这个定时任务后面我就放弃了,还是自己手搓吧。
这件事后来让我特别烦。
因为它不是一个“高难度智能体任务”。它不是要自己做招聘,不是要自己面试,不是要帮我处理一个复杂项目,就是每天定时整理信息、发帖。
如果这种任务都需要我天天盯着,那我到底是在让 AI 给我干活,还是我在给 AI 当运维?
这也是我后来才想明白的一点:
AI 能把某一次任务做对,和一个系统能被托管,是两回事。
一次任务做对,只需要模型当时聪明、上下文够、工具没坏。
但托管一个任务,需要它每天都能跑,跑错了能告诉我,告诉我以后能恢复,恢复以后不要污染下一次任务。
这几个要求听起来很朴素,但缺一个都不行。
因为只要我还要每天确认它有没有跑、跑得对不对、失败了有没有补救,它就不是自动化。
它只是把原来的工作,换成了另一套值班。
后来企业微信开放了机器人接口。
其实一开始我就想用企业微信,因为我们日常办公就是企业微信。但我不是管理员,也不知道怎么开。后面看到几个 AI 大佬的分享,才创建了自己的机器人。
到这一步,国内这块算是基本打通了。
再后来,微信也可以接入,甚至更简单。
但这个时候,OpenClaw 的使用体验反而更不踏实了。版本一更新,权限、稳定性、安装包和配置都要跟着处理,很多时候不是我在用它做事,而是在等它下一次别再出问题。
我看有人说是模型的问题,Kimi 2.5 的上下文长度很长,我买了;然后额度不够,阿里云百炼的是按次数调用的,我直接买了 200 的套餐,不怕 Token 的额度限制了(5 小时额度限制,之前买的智谱和 Kimi 套餐动不动就 API 错误,搞烦了)。3 月的时候,基本上智谱和 Kimi 每个套餐都跑满,有时候甚至第三天就能把一周额度跑没,不得不各种轮换,把阿里云的作为兜底。
但现在回头看,Token 和额度只是其中一部分。更重要的是时间和精力。
这些额度绝大部分都不是花在完成任务上,而是花在维护上。升级后崩溃,通道断联,记忆系统读不出来,梦境系统污染,定时任务失败,后台发布不通。写代码和自动化运行也一样,不是模型能力不够,就是权限、MCP、API、视觉识别、上下文这些问题叠在一起。
每天不是在修 bug,就是在修 bug 的路上。
干啥啥不行。
写代码、写文章、执行任务、定时任务、后台发布,每个任务都很难达到我的预期。更夸张一点说,这几个月里,它甚至没有一次跑完我真正想要的完整流程。
我以为 OpenClaw 能帮我节省很多时间和精力,结果折腾这么久,合着是给自己请了个祖宗供着。
问题不是它某一次回答聪不聪明,是不是能顺利完成任务,而是这套系统本身不够踏实。
Token 消耗值不值是一回事,重点是“没看到价值”。
套餐贵一点还能算账,算完觉得值就继续用,不值就停。但不稳定、不达预期这件事没法算。
钱其实是最容易算的。
Kimi 花了多少,智谱花了多少,阿里云百炼花了多少,Token 一天跑多少,这些都有数字。
真正难算的是注意力。
一个系统如果每天都可能出问题,我就会在心里给它留一个后台进程。哪怕我人在做别的事,也会惦记它今天跑没跑、有没有报错、会不会又把额度烧没了。
更麻烦的是信任。
只要它连续几次在简单任务上掉链子,我后面就不敢把更重要的任务交给它。哪怕它偶尔跑通一次,我也不敢真的放手。
所以问题不是它贵不贵。
问题是它一直在消耗我对它的信任。
它会把所有原本应该省下来的时间,变成新的排查、新的重试、新的等待。你以为自己在自动化,实际每天都在检查它有没有自动化成功。
这才是最消耗人的地方。
中间我还去过深圳线下安装的现场。
现场运营商、服务器厂商和技术人员都在。大概就是让大家下好安装包,然后工作人员直接帮忙操作安装。我看了一下,安装的不是 GitHub 上的原版,而是他们自己改过的版本。API 之类的也需要单独买,整个商业化味道很重。
这件事让我对“云龙虾”那套热闹冷静了一点。
你以为自己是在安装一个开源工具,但很多时候,后面接着的是服务器、API、模型套餐、安装服务、商业化版本。对个人用户来说,这不只是工具选择,也是一条不断增加成本的链路(当然,如果你觉得有帮到你,当我没说)
当然,这三个月也不是完全没有留下东西。
我确实学到了很多。
比如 Skill、工具的安装和测试。那段时间 X、小红书和公众号上到处都是各种开源、各种分享,仿佛分分钟就能获得大佬们几十年的经验。我也和许多人一样,有个新奇的 Skill 就想要安装,看看这个 Skill 用起来咋样。
我在 Obsidian 里有 3 年多的数据记录(从 2023 年开始用 Obsidian 记录的,日记记录的时间更早),包括日记、工作文件和各种记录。很多工具,我让 AI 提取里面的资料,再去测试安装的 Skill 和工具。
有些确实有用。
但更多时候,一测就露馅。
这部分我在《一次对话 2265 条信息,我和 AI 都经历了什么?》里写过,这里就不展开了。
还有记忆系统、进化系统、梦境系统和 Agent 人设。
OpenClaw 还没有官方进化系统的时候,我就已经在尝试了。把自己日记里和 Claude Code 里积累的东西喂进去,再结合各家的长处,前后折腾了好几个版本。
光是 MemOS 的记忆系统,我就处理了好几天。最后还是 MCP 链接不畅,记忆不好读取。
4 月 23 日,我让 AI 调整了一天的梦境,要么就是噪音太多(工具调用记录、代码修复之类的),做梦效果不好,要么就是数据出问题。看了源码,本身策略就偏保守,让 GPT 和 Opus 一直在上面打补丁,起到的效果也有限(AI 的说法是沟通的本来就有噪音,但我自认为聊得很好的时候,AI 也没有识别出来)
一直没有新的东西出来,倒是 AI 开始自己写日记了。
Agent 人设也折腾过。我直接把 Obsidian 里的数据给 AI 提取,这样效率会更高,甚至还让 Claude 帮我分析喜欢的游戏角色,打造了一个很像的助手(主要是角色的声优太让人着迷了哈哈)
这些东西都有价值。
问题在于:它们最后没有汇成一个稳定可用的 OpenClaw 主力工作流,这也是我最大的遗憾。
更尴尬的是,本来很多内容我都想写文章分享出来。结果拖延症严重,过了那个时间点,就不想动了。很多东西其实都没写。
后来我也试过 4 月底爆火的 Hermes Agent。稳定性已经很不错了,但我用的时候遇到过上下文串扰,在另一个聊天里,AI 居然能把上一个对话的反馈输出给我。
这种程度的 bug,导致我当场就卸载了,使用时间不到一天。
4 月底,我其实还试着救过一次。
4 月 24 日,我让 AI 把本机的 OpenClaw 和 Hermes 卸载了,准备重装,相关信息都备份了。当天重装了 OpenClaw,模型是用 GPT 的会员账号登录模式,设定还是之前那一套,Skill 慢慢安装。
4 月 26 日,早上刷抖音看到有人用钱老的《工程控制论》给小龙虾做计划,我又让 AI 给 OpenClaw 创建了一个执行计划,还继续把梦境系统优化了一下,结合工程控制论的思路打包了系列定时任务维稳,而且还能崩溃后自动抢救,准备先跑几天看看效果。
4 月 27 日,早上来看,AI 改的钱老的定时任务,前一天晚上 11 点多开始报错(额度跑没了哈哈哈哈哈),结果 GPT 的额度要 5 天后才能更新,AI 给我报了一晚上的错,全是 API 额度不足。
然后我大概算了一下,光是这个维稳的定时任务,每天要消耗 260 多万 Token。
于是我想着把定时任务让子 Agent 跑,让子 Agent 直接用本地的 9B 模型。中午的时候我还发现系统占用到 92% 左右,而且电脑开始有声音了(启动风扇,电脑也开始转彩虹了哈哈哈哈)
然后让 AI 自己写了个路由,子 Agent 换模型,只有 Kimi 2.5 稳定一些,但也只是“稳定一些”。不是说它就真的把流程跑通了。
4 月 28 日,早上继续修昨天定时任务失败的问题。修着修着,Claude 客户端直接限额。
上下文一句话,一个任务没跑完就满了。
还是不够用。
到这里,我就真的不想继续了。
累了,毁灭吧。
于是就回到了开头卸载的一幕。最后还是回到了 Claude Code 和 Codex。
不是因为它们完美。
而是因为它们更接近我现在真实的需求。
我现在反而更能接受 Claude Code 和 Codex 这种边界很窄的工具。
它不承诺一直在线,也不承诺越来越懂我,更不会假装自己是一个团队。
我要做什么,就把任务拆清楚,让它读文件、改东西、跑验证。
错了就是错了,卡了就是卡了。
它的问题暴露在我眼前,反而让我更安心一点。
因为我知道自己是在用一个工具,而不是在维护一个我也不知道什么时候会出问题的系统。
它也会出错,也会卡,也会有上下文和模型限制。
但至少问题更直接,坏在哪里也更容易定位。
这大概就是我三个月以后最大的变化。
一开始,我以为个人 AI 助手最重要的是像不像人,能不能长期记住我,能不能自我进化。
现在我反而觉得:个人 AI 助手最难的不是像不像人,而是能不能让人放心不盯着。
最重要的是三个很朴素的问题:
  1. 它稳定吗?
  2. 它能踏实跑完任务吗?
  3. 它真的让我少做事了吗?
真实需求是稳定、踏实跑任务,至于其他什么长驻、人格之类的都是锦上添花。
如果这三个问题回答不上来,那它再酷,也只是另一种负担。
我不是不愿意折腾。
我只是不想再把“维护”当成我的日常工作了。
以上只是我一个人这三个月的尝试。你的环境、行业、习惯都跟我不一样,可能会走出完全不同的路。
但如果你也在搭自己的 Agent,至少可以先问一句:
它现在有没有真正帮你少做事?
这个问题回答不上来,后面那些东西,估计都可以先等一等。
至少目前我是这样。
祝好
陆离 敬上
2026/05/10 写于深圳