各位小伙伴,大家好!我是冰可乐。最近 OpenClaw 火遍全网,我一直计划写一篇相关文章,但因沉迷《金刚经》的研究而迟迟未动笔。前几天,我特意购置了一台新设备用于运行 OpenClaw,经过几天的体验,今天就来和大家分享一下我的感受。
OpenClaw 安装配置
因为 OpenClaw 需要 24 小时不间断的运行,所以最好还是部署在一台低功耗的设备上,不然烧的不只是 Token,还是电费。我本来有一台笔记本在不间断运行的,但是因为 OpenClaw 的权限比较高,容易搞破坏,所有还是决定单独买一台设备。转了一大圈的闲鱼,买了一台 J900 的小主机、4G 内存、64G 固态。虽然配置很低,但是如果用云端模型,应该不是问题(事实也证明了没有问题)。
我觉得软件安装还是蛮简单的,最大的问题就是你需要有稳定的国际互联网接入方法,我是用笔记本做了网关,所以直接 npm -g install openclaw 就搞定了。我看闲鱼上还有很多 199 上门安装的,真的是觉得有些魔幻了。
搞定了安装接下来就是模型和 im 接入问题,我开始是用了免费的 google gemini 和 千问,但是 OpenClaw 真的太烧 Token 了,没聊几句就触发了 API 限制。最后研究了一下还是买了 MiniMax 的 Coding Plan,我个人觉得还是挺划算的,每个月 29 块,如果只是个人开发使用完全没问题,使用下来感觉代码能力也还可以,我认为比 Qwen 强。
im 我最开始是接入的 Telegram Bot,但是说实话我的国际网关不是很稳定,所以还是想迁移到局域网里,这样比较方便,首先尝试了飞书,我只能说看见那个软件就已经劝退了,花里胡哨、恶心至极。后来尝试了云湖,但是没有搞定。最后选择了 Matrix,这是一个可以自部署的即时通讯工具,支持端到端加密。我真的很喜欢这种方式,能够掌控一切,不涉及隐私问题。(我朋友使用的是企业微信,但是我不喜欢)。
使用感受
部署好之后就开始迫不及待的开始使用!刚刚上手的第一感觉就是强,真的强。他真的像个私人助理一样,能理解你说的话,然后去操作你的电脑,简单的找个文件、整理文件、简单处理 Excel、总结网页什么的都不在话下。但是随着使用的深入才发现,他所表现的一切能力,皆是虚妄。
对于一些简单的任务他完全没问题,就像上边说的那样,但是这些明明只需要十几秒就能手动完成的事情,使用 OpenClaw 可能需要一两分钟才能完成,他需要理解你的意图、调用 Skill、执行、拿到结果、反思、确认等一系列过程,并且执行的结果不一定好坏。你需要清晰的描述你的需求,他才能很好的执行你的任务,就像是手把手教一个孩子做家务一样。但是有句话怎得说的,如果啥都问我,我要你干什么?
但是对于复杂的任务,他很明显的力不从心了,往往是你跟他一顿解释,反复说半天,但是他还是傻乎乎无法完成你的任务,比如真正的来创建一个工程,然后自己写代码完成你的需求。并且,它的工程代码能力相对于 Gemini Cli,iflow 等并没有什么差异——简单的没问题,复杂的搞不定。
原来的 Qwen、DeepSeek、ChatGPT 都是大模型 + MCP + 聊天界面,而 OpenClaw 是大模型 + Skill + im,Skill 让他有了操作系统的能力,im 让他以你熟悉的方式与他沟通,从主观上改变你的感受,让你像使用微信和助理布置任务一样来给大模型发号施令。虽然现在大模型的能力不断的提升,但是能做的依旧有限,除非能出现新的运行方式或模型架构。
对于网上一些评价的看法
OpenClaw 爆火之后出现很多评论,从刚开始的全民养龙虾到 Token 破产,再到隐私风波、花钱卸载。这一切看上去是如此的荒唐至极。接下来逐一评价一番。
花钱安装:《天道》里有一句话:“「如果我的能力只能让我穷困潦倒,那穷困潦倒就是我的价值」”。如果你连安装都搞不定,那你肯定也不会用。 Token破产:如今的Token依旧是稀缺品,并不像是水电那样的廉价资源。如果你没有让他产生足够的价值,那花一分钱也是不知得的;如果他产生的价值超过成本,那再贵也是值得的。隐私安全问题:你花钱雇佣一个智力有问题的人当助理,然后他把你的工作弄得一团糟,还将你的隐私信息发到网上,你觉得是谁的错呢?如今的大模型远没有达到稳定生产的地步,你歇斯底里的对象应该是当初那个轻率做出决定的你,而不是 OpenClaw。关于能力问题: OpenClaw只不过是给大模型套了一个im的壳而已,而如今的大模型远远没有达到网上所吹捧有的那种地步,Transformer也撑不起人们对他的期望。
OpenClaw 的一些技巧
关于 OpenClaw的使用方法:如果你现在配置的可以聊天了,那有什么不会的操作你只需要问他就行了,比如怎么安装插件,怎么安装Skill,怎么更换模型,更换im等,他能自己搞定。我第一次安装的时候matrix出现了问题,他自己折腾了两三个小时,给自己折腾好了。他每次重启完之后任务都会中断,你需要给他发送一个消息才能继续工作。关于代码能力:大模型的代码能力很强,但是工程能力很弱。对于一些简单的几百行能过够搞定的问题,直接和他说就可以,基本上都能实现,但是如果让他做一个工程那完全不够。他很难理解你的整体的项目需求,也很难一次性工程做好,你需要不断的让他添加新的功能、修改 bug 等。但是由于刚开始他没有完全理解你的需求,所以项目的结构很差,但是由于所有的 bug修改和功能添加都是一步一步出来的,所以他只会在原来的上面打补丁,直到一个文件超过几百几千行,超过他的接受范围(虽然模型上下文很大,但是还需要有大量的历史聊天、Skill信息、Prompt等,所有一旦代码比较长,能力就明显下降),就很难再优化了,这个时候如果你来接手,将会面临一堆屎山代码。我是让他编写了一个架构反思的Skill,来保持良好的架构风格和扩扩展性,感觉有一点用,还在打磨。关于 Token消耗:我使用的MiniMax的CodingPlan,一个月 29,感觉还算便宜,效果也还行。Token真的烧不起,我开始充了 10 块钱,平台送了 15,一共 25 块钱,不到一天就没了。关于 im接入:如果有稳定的国际互联网接入,首选TG;如果自己有服务器,首选Matrix;如果都没有,那就企业微信吧。
如果看待大模型的未来?
其实我很早之前就想聊聊对大模型的看法了,有一些想法,奈何水平不够,表达能力也差点意思,所以一直没写完,今天就借着这个机会简单聊聊。
从 ChatGPT 诞生,全世界就为之疯狂,但是我们不禁要问,难道 ChatGPT 就是横空出世的吗?当然不是,Transformer 早在 2017 年就被提出了,后来 OpenAI 大力出奇迹才让大模型能力涌现。如今的大模型都是基于 Transformer 架构,虽然进行了各种优化,但是本质没有区别,而 Transformer 本身就是虚妄。
经典的 Transformer 模型包括编码器和解码器两个部分,编码器将用来理解用户输入,解码器负责输出。这看上去没什么问题,但是最大的问题在于大模型是无状态的,也就说只能处理单次对话,下次再跟他对话他就不记得了。现在的解决方案就是通过上下文窗口,将历史对话信息一同输入到模型中,这样就好像他又记忆一样。但是上下文总归是有长度限制的,所以一旦进行长对话或者复杂任务,就会明显的能力下降,因为他记不住。
人的记忆能力也不是无限的,很多东西也记不住,那为什么人的综合能力如此强呢?因为人的学和做的过程并不是独立的,人会随着事情的发生不断的学习、积累经验,将新的技能纳入自己的认知体系中。模型只有在训练的时候才会学习,其它的全都是上下文罢了,而且模型只能进行概率拟合,并没有像人那样的认知体系。目前大模型所表现出来的一切都只不过是一个幻象,只是概率模型的梦幻泡影罢了。
最后的问题便是现有的所有模型全都不是实时模型(我这里所说的实时模型就是你一边说他一边想),全都是对话式模型,只能一次性获取输入,输出完毕后在重新获取输入,再输出。这样即便是中间出现很明显的错误,却没有任何弥补措施。虽然从计算机诞生以来就通过高速的串行来骗过人类,就好像是并行的一样,但是在短时间内的算力发展远没有让大模型达到如此地步(好像有实验室实现了将模型权重刻在硅片上,速度提升了一千倍不止,希望能够尽快普及)。
普通人如何拥抱 AI 时代?
虽然目前的大模型能力远没有像吹捧的那样无所不能,但是毫无疑问的是它必定将改变所有人的生活。通过 AI 辅助的确能够明显的提高我们的生产力。那作为一个普通人我们需要怎样才能赶上时代的脚步呢?以下是一些我的个人看法:
「拥抱变化」:不要对新技术嗤之以鼻,即便现在它并不能完成你的工作,你也要尝试着去使用它,看看他能做哪些、不能做哪些、存在哪些问题,是不是不是可以解决。 「通过大模型提升自己」:虽然目前的大模型很难做好一件事,但是他的确懂得很多。以前如果你想入门一个专业只能通过阅读、翻阅资料,在建立一个基本的认知后再动手,然后不断的深入,这其中会遇到很多问题,你需要很多精力去研究。但是如今,你可以简单聊几句后就直接动手,遇到问题也会有“人”给你细心的解答。就好像以前吃饭要自己买菜、洗菜、做饭,还只能吃一道菜,但是如今有了大模型就是直接点菜直接吃。 「提升表达能力」:不管大模型发展到任何时候,只要人类还没有被 AI圈养起来,那提出需求的主体永远是人。而如何清晰的表达自己的逻辑和需求将是一种很重要的能力。
结语
好啦,今天的分享就到这里,以上的内容只代表个人看法,如果你有什么不同的看法,欢迎在评论区留言讨论或者私信给我讨论!
夜雨聆风