折腾 OpenClaw 三个月后,我把它卸载了-夜雨聆风

折腾 OpenClaw 三个月后,我把它卸载了

从 Clawdbot 入局，到现在的 OpenClaw，三个月后，我选择把 OpenClaw 卸载了。

这不是我第一次卸载 OpenClaw，但确实是最后一次（毕竟中间删除又安装折腾过好几次，云端、本地也是各种折腾了好几次）。

过去的 3 月、4 月，每天大部分的时间和精力都消耗在 OpenClaw 的维护上。定时任务、Skill 执行，没有一个是能在无人值守的情况下顺利完成的，太累了。

正好五一放假，先休息几天，慎重考虑一下是否值得。

然后我就卸载了。

我留下了几个放在 Dropbox 里的人设和规则文件，算是给这几个月留一点痕迹（调教出一个人设不容易）。其他所有 Skill、聊天记录啥的，能清的都清掉，所有文件和设置也都进行清理，尽量还原到没有安装过 OpenClaw 的状态。

——终于不用在每天修理 OpenClaw 的日常中生活了哈哈哈。

故事的一开始，还是从一个美好的想法开始。

1 月底的一天，我在 X 上面随意逛着看 AI 新闻，刷到几个 OpenClaw 的传播案例。当时还没太当回事，就当看几个营销号乐呵乐呵。

后来又刷小红书，看到有人在推这个新的个人助理，说它是 7 * 24 小时不间断的电脑牛马，可以控制你电脑的所有权限。案例都是 OpenClaw 自己找工具、自己跑流程、自己完成现实世界里的任务。给人的感觉很是不错：这不是一个只会聊天的 AI，它好像真的能把一个任务接过去，然后自己往前推进。

当时自己用 Claude Code 有一段时间了，Claude cowork 功能刚开始发布（只有 Claude 的客户端才能用，我没有付费也就没法体验），我觉感觉好像还缺了点什么。

刷到小红书的笔记后不久，再看看 X 上面的新闻，我才想到 Claude cowork 缺了啥。

缺了一个通信通道，一个我们可以随时指挥它的联系方式，而不是必须把我们“按”在电脑面前。

后来我才发现，这只是一个误判。

Telegram、Discord、飞书、企业微信，看起来像是把 AI 从电脑里放了出来，像一个随时可以叫到的人。

通信通道解决的只是“我怎么找到它”。

它没有自动解决“它怎么理解任务、怎么连续执行、怎么知道自己错了、错了以后怎么恢复”。

我当时上头的地方就在这里。

我以为把 AI 接到更多地方，它就离真实工作流更近了。后来才发现，它只是满足我们24小时不断 “Work” 的假象而已。。

那段时间我准备招人，所以看到这些内容的时候，脑子里冒出来的一个想法特别具体：

如果我能安装一个这样的 Agent，让它根据我的要求去招聘网站发 JD，有简历了自动筛选，然后合适的自己约电话面试；到了时间自己装个 TTS 自己去帮我面试，然后给我报告决定要不要发 Offer，这样就完美了。

——自己想办法把自己干掉了属于是。哈哈哈哈哈哈哈。

招聘只是我当时脑子里第一个冒出来的例子。后面还有写文章、筛选信息、定时发日报、处理后台发布，甚至帮我盯着一些重复性工作。

我想看看这个产品能不能做到吹牛的这种程度。

于是，我在 Claude Code 的帮助下安装好了第一版，配置到了 Telegram 上，先用的是智谱（为此还当了一回智谱的合伙人，上市的易拉罐也有我的一份哈哈哈）。

然后第二天就开始不对劲。

提问没有反馈，要么就是没法调用，后面直接来个 API 余额不足。我去智谱后台一看，好家伙，已经用了 98% 的量（全是调用工具造成的）。

那会儿其实也没觉得这个工具不行。

当时的想法是，刚开始用，而且这个产品本身还是开源的，折腾一下也很正常。

转眼就快过年了，工作上的事儿也多，就这样边折腾边等过年，慢慢养着呗。

春节期间，半个月基本没碰。

节后回来，不知道为什么，OpenClaw 突然就火了。各个公司开始宣传自家的龙虾，微信群里，到处都是讨论龙虾的人。小红书上，公众号里，都是各种小龙虾的攻略，热闹得不行。

那时候我还在折腾通道和定时任务。

通道一开始选的是 Telegram，但这个工具在国内使用还是不太方便，后来我就迁移到了飞书上。

飞书这块我折腾了很久。机器人怎么配置，走 WebSocket 长连接还是 Webhook（我之前一直记成 welook，后来才发现是自己记错了），权限怎么开，消息怎么回，都是问题。

而且飞书刚开始用起来有个特别难受的地方：你发一个消息，只能等 AI 回复。中间它到底有没有正常运行，是不是卡住了，是不是在调用工具，完全靠猜（后来好像开始支持流式输出了，体验才稍微好一点；不过那时候我又已经迁移到 Discord 和企业微信了哈哈哈哈）。

通道差不多了以后，我就开始折腾多 Agent 模式和定时任务。

我让 OpenClaw 创建了 9 个子 Agent，每个 Agent 都对应一个飞书机器人，还给它配置了头像、昵称和完整的人设（我用 Gemini 按照虚拟公司的操作，给每个 Agent 都设定了完整的用户画像，包括姓名、职业、行为习惯、社交关系等）。期间我也折腾了好多 Skill，还一度设想把 Skill 拆成不同的环节（原子化），让不同的 Agent 有不同的 Skill 和上下文，想让它们以虚拟公司的模式运行。

结果，没跑起来哈哈哈哈哈哈（飞书不支持机器人相互 @）！

后来才知道，飞书有自己的限制。一个是消息数，当时一个月好像只有 18000 的量（后面才放开或者优惠，这个时间点我有点记不清）；另一个是多个 Agent 不能互相 @，也就没法实现我想象中那种团队协作。

于是我又迁移到了 Discord，据说可以多 Agent 相互 @，能实现我的理想。

Discord 的频道和论坛模型，看起来确实更适合这种任务。OpenClaw 自己创建子频道，自己在里面发帖，这个反而跑得不错。

我当时想法很美好：每天早上 9 点，自动发 AI 日报到 Discord 的文字论坛里。

这个任务我本来觉得不算离谱。信息源规定好了，输出的模板也有现成的，OpenClaw 也测试过在频道里发帖和回复。理论上，它每天到点跑一下，把当天 AI 相关的信息整理出来，再照猫画虎按格式发到论坛里就行。

结果第二天一看，什么都没有。一看后台，一堆报错日志。

我手动让它重新跑，问题又换了一种形式出现：信息源开始幻觉，明明限定过来源，它还是会自己编；好不容易把来源问题压下去，发帖又不按规定格式来；格式刚修完，通道又断了。

前后改了好几次，每一次都像是快好了，但没有一次真正顺畅跑完。

这个定时任务后面我就放弃了，还是自己手搓吧。

这件事后来让我特别烦。

因为它不是一个“高难度智能体任务”。它不是要自己做招聘，不是要自己面试，不是要帮我处理一个复杂项目，就是每天定时整理信息、发帖。

如果这种任务都需要我天天盯着，那我到底是在让 AI 给我干活，还是我在给 AI 当运维？

这也是我后来才想明白的一点：

AI 能把某一次任务做对，和一个系统能被托管，是两回事。

一次任务做对，只需要模型当时聪明、上下文够、工具没坏。

但托管一个任务，需要它每天都能跑，跑错了能告诉我，告诉我以后能恢复，恢复以后不要污染下一次任务。

这几个要求听起来很朴素，但缺一个都不行。

因为只要我还要每天确认它有没有跑、跑得对不对、失败了有没有补救，它就不是自动化。

它只是把原来的工作，换成了另一套值班。

后来企业微信开放了机器人接口。

其实一开始我就想用企业微信，因为我们日常办公就是企业微信。但我不是管理员，也不知道怎么开。后面看到几个 AI 大佬的分享，才创建了自己的机器人。

到这一步，国内这块算是基本打通了。

再后来，微信也可以接入，甚至更简单。

但这个时候，OpenClaw 的使用体验反而更不踏实了。版本一更新，权限、稳定性、安装包和配置都要跟着处理，很多时候不是我在用它做事，而是在等它下一次别再出问题。

我看有人说是模型的问题，Kimi 2.5 的上下文长度很长，我买了；然后额度不够，阿里云百炼的是按次数调用的，我直接买了 200 的套餐，不怕 Token 的额度限制了（5 小时额度限制，之前买的智谱和 Kimi 套餐动不动就 API 错误，搞烦了）。3 月的时候，基本上智谱和 Kimi 每个套餐都跑满，有时候甚至第三天就能把一周额度跑没，不得不各种轮换，把阿里云的作为兜底。

但现在回头看，Token 和额度只是其中一部分。更重要的是时间和精力。

这些额度绝大部分都不是花在完成任务上，而是花在维护上。升级后崩溃，通道断联，记忆系统读不出来，梦境系统污染，定时任务失败，后台发布不通。写代码和自动化运行也一样，不是模型能力不够，就是权限、MCP、API、视觉识别、上下文这些问题叠在一起。

每天不是在修 bug，就是在修 bug 的路上。

干啥啥不行。

写代码、写文章、执行任务、定时任务、后台发布，每个任务都很难达到我的预期。更夸张一点说，这几个月里，它甚至没有一次跑完我真正想要的完整流程。

我以为 OpenClaw 能帮我节省很多时间和精力，结果折腾这么久，合着是给自己请了个祖宗供着。

问题不是它某一次回答聪不聪明，是不是能顺利完成任务，而是这套系统本身不够踏实。

Token 消耗值不值是一回事，重点是“没看到价值”。

套餐贵一点还能算账，算完觉得值就继续用，不值就停。但不稳定、不达预期这件事没法算。

钱其实是最容易算的。

Kimi 花了多少，智谱花了多少，阿里云百炼花了多少，Token 一天跑多少，这些都有数字。

真正难算的是注意力。

一个系统如果每天都可能出问题，我就会在心里给它留一个后台进程。哪怕我人在做别的事，也会惦记它今天跑没跑、有没有报错、会不会又把额度烧没了。

更麻烦的是信任。

只要它连续几次在简单任务上掉链子，我后面就不敢把更重要的任务交给它。哪怕它偶尔跑通一次，我也不敢真的放手。

所以问题不是它贵不贵。

问题是它一直在消耗我对它的信任。

它会把所有原本应该省下来的时间，变成新的排查、新的重试、新的等待。你以为自己在自动化，实际每天都在检查它有没有自动化成功。

这才是最消耗人的地方。

中间我还去过深圳线下安装的现场。

现场运营商、服务器厂商和技术人员都在。大概就是让大家下好安装包，然后工作人员直接帮忙操作安装。我看了一下，安装的不是 GitHub 上的原版，而是他们自己改过的版本。API 之类的也需要单独买，整个商业化味道很重。

这件事让我对“云龙虾”那套热闹冷静了一点。

你以为自己是在安装一个开源工具，但很多时候，后面接着的是服务器、API、模型套餐、安装服务、商业化版本。对个人用户来说，这不只是工具选择，也是一条不断增加成本的链路（当然，如果你觉得有帮到你，当我没说）。

当然，这三个月也不是完全没有留下东西。

我确实学到了很多。

比如 Skill、工具的安装和测试。那段时间 X、小红书和公众号上到处都是各种开源、各种分享，仿佛分分钟就能获得大佬们几十年的经验。我也和许多人一样，有个新奇的 Skill 就想要安装，看看这个 Skill 用起来咋样。

我在 Obsidian 里有 3 年多的数据记录（从 2023 年开始用 Obsidian 记录的，日记记录的时间更早），包括日记、工作文件和各种记录。很多工具，我让 AI 提取里面的资料，再去测试安装的 Skill 和工具。

有些确实有用。

但更多时候，一测就露馅。

这部分我在《一次对话 2265 条信息，我和 AI 都经历了什么？》里写过，这里就不展开了。

还有记忆系统、进化系统、梦境系统和 Agent 人设。

OpenClaw 还没有官方进化系统的时候，我就已经在尝试了。把自己日记里和 Claude Code 里积累的东西喂进去，再结合各家的长处，前后折腾了好几个版本。

光是 MemOS 的记忆系统，我就处理了好几天。最后还是 MCP 链接不畅，记忆不好读取。

4 月 23 日，我让 AI 调整了一天的梦境，要么就是噪音太多（工具调用记录、代码修复之类的），做梦效果不好，要么就是数据出问题。看了源码，本身策略就偏保守，让 GPT 和 Opus 一直在上面打补丁，起到的效果也有限（AI 的说法是沟通的本来就有噪音，但我自认为聊得很好的时候，AI 也没有识别出来）。

一直没有新的东西出来，倒是 AI 开始自己写日记了。

Agent 人设也折腾过。我直接把 Obsidian 里的数据给 AI 提取，这样效率会更高，甚至还让 Claude 帮我分析喜欢的游戏角色，打造了一个很像的助手（主要是角色的声优太让人着迷了哈哈）。

这些东西都有价值。

问题在于：它们最后没有汇成一个稳定可用的 OpenClaw 主力工作流，这也是我最大的遗憾。

更尴尬的是，本来很多内容我都想写文章分享出来。结果拖延症严重，过了那个时间点，就不想动了。很多东西其实都没写。

后来我也试过 4 月底爆火的 Hermes Agent。稳定性已经很不错了，但我用的时候遇到过上下文串扰，在另一个聊天里，AI 居然能把上一个对话的反馈输出给我。

这种程度的 bug，导致我当场就卸载了，使用时间不到一天。

4 月底，我其实还试着救过一次。

4 月 24 日，我让 AI 把本机的 OpenClaw 和 Hermes 卸载了，准备重装，相关信息都备份了。当天重装了 OpenClaw，模型是用 GPT 的会员账号登录模式，设定还是之前那一套，Skill 慢慢安装。

4 月 26 日，早上刷抖音看到有人用钱老的《工程控制论》给小龙虾做计划，我又让 AI 给 OpenClaw 创建了一个执行计划，还继续把梦境系统优化了一下，结合工程控制论的思路打包了系列定时任务维稳，而且还能崩溃后自动抢救，准备先跑几天看看效果。

4 月 27 日，早上来看，AI 改的钱老的定时任务，前一天晚上 11 点多开始报错（额度跑没了哈哈哈哈哈），结果 GPT 的额度要 5 天后才能更新，AI 给我报了一晚上的错，全是 API 额度不足。

然后我大概算了一下，光是这个维稳的定时任务，每天要消耗 260 多万 Token。

于是我想着把定时任务让子 Agent 跑，让子 Agent 直接用本地的 9B 模型。中午的时候我还发现系统占用到 92% 左右，而且电脑开始有声音了（启动风扇，电脑也开始转彩虹了哈哈哈哈）。

然后让 AI 自己写了个路由，子 Agent 换模型，只有 Kimi 2.5 稳定一些，但也只是“稳定一些”。不是说它就真的把流程跑通了。

4 月 28 日，早上继续修昨天定时任务失败的问题。修着修着，Claude 客户端直接限额。

上下文一句话，一个任务没跑完就满了。

还是不够用。

到这里，我就真的不想继续了。

累了，毁灭吧。

于是就回到了开头卸载的一幕。最后还是回到了 Claude Code 和 Codex。

不是因为它们完美。

而是因为它们更接近我现在真实的需求。

我现在反而更能接受 Claude Code 和 Codex 这种边界很窄的工具。

它不承诺一直在线，也不承诺越来越懂我，更不会假装自己是一个团队。

我要做什么，就把任务拆清楚，让它读文件、改东西、跑验证。

错了就是错了，卡了就是卡了。

它的问题暴露在我眼前，反而让我更安心一点。

因为我知道自己是在用一个工具，而不是在维护一个我也不知道什么时候会出问题的系统。

它也会出错，也会卡，也会有上下文和模型限制。

但至少问题更直接，坏在哪里也更容易定位。

这大概就是我三个月以后最大的变化。

一开始，我以为个人 AI 助手最重要的是像不像人，能不能长期记住我，能不能自我进化。

现在我反而觉得：个人 AI 助手最难的不是像不像人，而是能不能让人放心不盯着。

最重要的是三个很朴素的问题：

它稳定吗？
它能踏实跑完任务吗？
它真的让我少做事了吗？

真实需求是稳定、踏实跑任务，至于其他什么长驻、人格之类的都是锦上添花。

如果这三个问题回答不上来，那它再酷，也只是另一种负担。

我不是不愿意折腾。

我只是不想再把“维护”当成我的日常工作了。

以上只是我一个人这三个月的尝试。你的环境、行业、习惯都跟我不一样，可能会走出完全不同的路。

但如果你也在搭自己的 Agent，至少可以先问一句：

它现在有没有真正帮你少做事？

这个问题回答不上来，后面那些东西，估计都可以先等一等。

至少目前我是这样。

祝好

陆离敬上

2026/05/10 写于深圳