OpenClaw——凡所有相,皆是虚妄

各位小伙伴，大家好！我是冰可乐。最近 OpenClaw 火遍全网，我一直计划写一篇相关文章，但因沉迷《金刚经》的研究而迟迟未动笔。前几天，我特意购置了一台新设备用于运行 OpenClaw，经过几天的体验，今天就来和大家分享一下我的感受。

OpenClaw 安装配置

因为 OpenClaw 需要 24 小时不间断的运行，所以最好还是部署在一台低功耗的设备上，不然烧的不只是 Token，还是电费。我本来有一台笔记本在不间断运行的，但是因为 OpenClaw 的权限比较高，容易搞破坏，所有还是决定单独买一台设备。转了一大圈的闲鱼，买了一台 J900 的小主机、4G 内存、64G 固态。虽然配置很低，但是如果用云端模型，应该不是问题（事实也证明了没有问题）。

我觉得软件安装还是蛮简单的，最大的问题就是你需要有稳定的国际互联网接入方法，我是用笔记本做了网关，所以直接 npm -g install openclaw 就搞定了。我看闲鱼上还有很多 199 上门安装的，真的是觉得有些魔幻了。

搞定了安装接下来就是模型和 im 接入问题，我开始是用了免费的 google gemini 和 千问，但是 OpenClaw 真的太烧 Token 了，没聊几句就触发了 API 限制。最后研究了一下还是买了 MiniMax 的 Coding Plan，我个人觉得还是挺划算的，每个月 29 块，如果只是个人开发使用完全没问题，使用下来感觉代码能力也还可以，我认为比 Qwen 强。

im 我最开始是接入的 Telegram Bot，但是说实话我的国际网关不是很稳定，所以还是想迁移到局域网里，这样比较方便，首先尝试了飞书，我只能说看见那个软件就已经劝退了，花里胡哨、恶心至极。后来尝试了云湖，但是没有搞定。最后选择了 Matrix，这是一个可以自部署的即时通讯工具，支持端到端加密。我真的很喜欢这种方式，能够掌控一切，不涉及隐私问题。（我朋友使用的是企业微信，但是我不喜欢）。

使用感受

部署好之后就开始迫不及待的开始使用！刚刚上手的第一感觉就是强，真的强。他真的像个私人助理一样，能理解你说的话，然后去操作你的电脑，简单的找个文件、整理文件、简单处理 Excel、总结网页什么的都不在话下。但是随着使用的深入才发现，他所表现的一切能力，皆是虚妄。

对于一些简单的任务他完全没问题，就像上边说的那样，但是这些明明只需要十几秒就能手动完成的事情，使用 OpenClaw 可能需要一两分钟才能完成，他需要理解你的意图、调用 Skill、执行、拿到结果、反思、确认等一系列过程，并且执行的结果不一定好坏。你需要清晰的描述你的需求，他才能很好的执行你的任务，就像是手把手教一个孩子做家务一样。但是有句话怎得说的，如果啥都问我，我要你干什么？

但是对于复杂的任务，他很明显的力不从心了，往往是你跟他一顿解释，反复说半天，但是他还是傻乎乎无法完成你的任务，比如真正的来创建一个工程，然后自己写代码完成你的需求。并且，它的工程代码能力相对于 Gemini Cli，iflow 等并没有什么差异——简单的没问题，复杂的搞不定。

原来的 Qwen、DeepSeek、ChatGPT 都是大模型 + MCP + 聊天界面，而 OpenClaw 是大模型 + Skill + im，Skill 让他有了操作系统的能力，im 让他以你熟悉的方式与他沟通，从主观上改变你的感受，让你像使用微信和助理布置任务一样来给大模型发号施令。虽然现在大模型的能力不断的提升，但是能做的依旧有限，除非能出现新的运行方式或模型架构。

对于网上一些评价的看法

OpenClaw 爆火之后出现很多评论，从刚开始的全民养龙虾到 Token 破产，再到隐私风波、花钱卸载。这一切看上去是如此的荒唐至极。接下来逐一评价一番。

花钱安装：《天道》里有一句话：“「如果我的能力只能让我穷困潦倒，那穷困潦倒就是我的价值」”。如果你连安装都搞不定，那你肯定也不会用。
Token 破产：如今的 Token 依旧是稀缺品，并不像是水电那样的廉价资源。如果你没有让他产生足够的价值，那花一分钱也是不知得的；如果他产生的价值超过成本，那再贵也是值得的。
隐私安全问题：你花钱雇佣一个智力有问题的人当助理，然后他把你的工作弄得一团糟，还将你的隐私信息发到网上，你觉得是谁的错呢？如今的大模型远没有达到稳定生产的地步，你歇斯底里的对象应该是当初那个轻率做出决定的你，而不是 OpenClaw。
关于能力问题：OpenClaw 只不过是给大模型套了一个 im 的壳而已，而如今的大模型远远没有达到网上所吹捧有的那种地步，Transformer 也撑不起人们对他的期望。

OpenClaw 的一些技巧

关于 OpenClaw 的使用方法：如果你现在配置的可以聊天了，那有什么不会的操作你只需要问他就行了，比如怎么安装插件，怎么安装 Skill，怎么更换模型，更换 im 等，他能自己搞定。我第一次安装的时候 matrix 出现了问题，他自己折腾了两三个小时，给自己折腾好了。他每次重启完之后任务都会中断，你需要给他发送一个消息才能继续工作。
关于代码能力：大模型的代码能力很强，但是工程能力很弱。对于一些简单的几百行能过够搞定的问题，直接和他说就可以，基本上都能实现，但是如果让他做一个工程那完全不够。他很难理解你的整体的项目需求，也很难一次性工程做好，你需要不断的让他添加新的功能、修改 bug 等。但是由于刚开始他没有完全理解你的需求，所以项目的结构很差，但是由于所有的 bug 修改和功能添加都是一步一步出来的，所以他只会在原来的上面打补丁，直到一个文件超过几百几千行，超过他的接受范围（虽然模型上下文很大，但是还需要有大量的历史聊天、Skill 信息、Prompt 等，所有一旦代码比较长，能力就明显下降），就很难再优化了，这个时候如果你来接手，将会面临一堆屎山代码。我是让他编写了一个架构反思的 Skill，来保持良好的架构风格和扩扩展性，感觉有一点用，还在打磨。
关于 Token 消耗：我使用的 MiniMax 的 CodingPlan，一个月 29，感觉还算便宜，效果也还行。Token 真的烧不起，我开始充了 10 块钱，平台送了 15，一共 25 块钱，不到一天就没了。
关于 im 接入：如果有稳定的国际互联网接入，首选 TG；如果自己有服务器，首选 Matrix；如果都没有，那就企业微信吧。

如果看待大模型的未来？

其实我很早之前就想聊聊对大模型的看法了，有一些想法，奈何水平不够，表达能力也差点意思，所以一直没写完，今天就借着这个机会简单聊聊。

从 ChatGPT 诞生，全世界就为之疯狂，但是我们不禁要问，难道 ChatGPT 就是横空出世的吗？当然不是，Transformer 早在 2017 年就被提出了，后来 OpenAI 大力出奇迹才让大模型能力涌现。如今的大模型都是基于 Transformer 架构，虽然进行了各种优化，但是本质没有区别，而 Transformer 本身就是虚妄。

经典的 Transformer 模型包括编码器和解码器两个部分，编码器将用来理解用户输入，解码器负责输出。这看上去没什么问题，但是最大的问题在于大模型是无状态的，也就说只能处理单次对话，下次再跟他对话他就不记得了。现在的解决方案就是通过上下文窗口，将历史对话信息一同输入到模型中，这样就好像他又记忆一样。但是上下文总归是有长度限制的，所以一旦进行长对话或者复杂任务，就会明显的能力下降，因为他记不住。

人的记忆能力也不是无限的，很多东西也记不住，那为什么人的综合能力如此强呢？因为人的学和做的过程并不是独立的，人会随着事情的发生不断的学习、积累经验，将新的技能纳入自己的认知体系中。模型只有在训练的时候才会学习，其它的全都是上下文罢了，而且模型只能进行概率拟合，并没有像人那样的认知体系。目前大模型所表现出来的一切都只不过是一个幻象，只是概率模型的梦幻泡影罢了。

最后的问题便是现有的所有模型全都不是实时模型（我这里所说的实时模型就是你一边说他一边想），全都是对话式模型，只能一次性获取输入，输出完毕后在重新获取输入，再输出。这样即便是中间出现很明显的错误，却没有任何弥补措施。虽然从计算机诞生以来就通过高速的串行来骗过人类，就好像是并行的一样，但是在短时间内的算力发展远没有让大模型达到如此地步（好像有实验室实现了将模型权重刻在硅片上，速度提升了一千倍不止，希望能够尽快普及）。

普通人如何拥抱 AI 时代？

虽然目前的大模型能力远没有像吹捧的那样无所不能，但是毫无疑问的是它必定将改变所有人的生活。通过 AI 辅助的确能够明显的提高我们的生产力。那作为一个普通人我们需要怎样才能赶上时代的脚步呢？以下是一些我的个人看法：

「拥抱变化」：不要对新技术嗤之以鼻，即便现在它并不能完成你的工作，你也要尝试着去使用它，看看他能做哪些、不能做哪些、存在哪些问题，是不是不是可以解决。
「通过大模型提升自己」：虽然目前的大模型很难做好一件事，但是他的确懂得很多。以前如果你想入门一个专业只能通过阅读、翻阅资料，在建立一个基本的认知后再动手，然后不断的深入，这其中会遇到很多问题，你需要很多精力去研究。但是如今，你可以简单聊几句后就直接动手，遇到问题也会有“人”给你细心的解答。就好像以前吃饭要自己买菜、洗菜、做饭，还只能吃一道菜，但是如今有了大模型就是直接点菜直接吃。
「提升表达能力」：不管大模型发展到任何时候，只要人类还没有被 AI 圈养起来，那提出需求的主体永远是人。而如何清晰的表达自己的逻辑和需求将是一种很重要的能力。

结语

好啦，今天的分享就到这里，以上的内容只代表个人看法，如果你有什么不同的看法，欢迎在评论区留言讨论或者私信给我讨论！