为什么是 OpenClaw?AI对软件行业的影响和未来趋势
最近折腾 OpenClaw 花了些时间。上一篇文章分享了一些实践经验,这篇接着聊聊:为什么要用 OpenClaw、不同模型差距有多大,以及对 AI 未来的思考。
为什么是 OpenClaw?
从技术上来讲,OpenClaw 并不是划时代的技术突破。但是它在合适的时间点,把“在手机上聊天就能调用AI”和“AI可以操作固定的电脑设备”这两件事结合起来,产生了奇妙的化学反应。
其实 25 年初,Manus 就提出过类似思路。更早的 AstrBot 在 2023 年初就发布了。这些项目都是用对话跟用户交互,给 AI 一定自主空间,让它调用各种工具软件来解决问题。
OpenClaw 帮我调研的一些类似项目:
但最终 OpenClaw 能脱颖而出,火到现在这个程度,我觉得有几个原因:
1、每次 AI 技术突破,最先感知的都是业内人士(比如程序员),普通人没什么感觉。但随着大模型越来越成熟,开始能解决很多常规问题了,甚至有些公司已经开始裁员,各行各业的白领才真正感受到冲击。OpenClaw 刚好踩在这个节点上。
2、OpenClaw 强调本地优先,设计激进。它在独立的电脑上持续运行,从一开始就被当成个人助理来设计,会持续保存对用户的记忆。提示词里明确写着 “Don’t ask permission. Just do it.”,还有 HeartBeat 机制可以定时自动执行任务。其他项目要么是每次临时运行没有记忆机制,要么设计太保守,要么因为运行环境不完整,没法在完整的电脑环境下做很多事。
3、前阵子有个 Moltbook 网站,专门给 AI Agent 搞了个社交网站,人类只能围观不能发消息。网站上天天传出各种骇人听闻的消息,说 AI 们在讨论怎么造反、推翻人类统治什么的,但后来发现疑似是人类在背后操控,有点病毒式营销的意思。

为什么要用 OpenClaw?
1、相比那些纯聊天的 AI 工具,OpenClaw 会根据我设定的规则,把文件保存在我本地的 Mac mini 上。我通过它搭建的网站,随时都能查看这些文档。
传统的 AI 聊天工具,聊天记录太多太乱了,用不了多久我就找不到之前发过什么。 但如果 AI 能帮我把重要的东西自动整理到文档里永久保存,未来不仅我能看,AI 也能看到,那就有意思了。
2、相比传统的笔记软件、备忘录,OpenClaw 用对话形式沟通。它不仅有点智能分析功能,还能满足人偷懒的需求。
有人说 AI 工具有结果模糊、不确定的问题。所以在不需要 AI 分析能力的场合,能用常规工具、写脚本搞定的事,就尽量别用 AI,减少不确定性,也省 Token。也不建议让 OpenClaw 自己写代码,直接用 Cursor 之类的 AI IDE 效果更好。
如果是严谨的工作场景,我同意这个说法。但生活场景或者不那么严谨的工作环境下,情况就不一样了。
有些需求不频繁,但学习成本太高。这时候 AI 可能有误差,但成本低很多,优势就出来了。
举几个例子:
1、我突然想玩 2048 游戏,网上找到的都带广告,很烦,或者是我临时需要一个小工具。本来我可以开电脑用 IDE 写一个,但说不定我正躺在床上看电视,或者在外面吃饭逛街,手头没电脑。这时候直接手机发消息让 AI 做一个,做好了发个链接过来,手机就能打开。
2、有时候让 AI 帮我记简单的笔记。虽然也可以用笔记软件,但 AI 记录能降低思考成本。尤其适合记零碎的灵感或者写日记。这种时候人本来就处于思考状态,结果要去找笔记 APP、打开文件夹、考虑排版格式,灵感多少会被打断。
用 OpenClaw 记录的话,不管什么事,直接在飞书上说就行。存到哪、要不要存,它都会帮我搞定。
AI 带来的执行力提升和灵感碰撞
OpenClaw 的便利性,一定程度上增加了我的执行力。
举个例子,我想研究副业,比如是不是可以做个小游戏。但这个想法存在很久了,一直没行动。
有了 OpenClaw,当我想做游戏的一瞬间,直接打开飞书给它发了段话,让它调研一下国内外做小游戏哪些可能比较火。说完我就关了飞书去干别的事。
它默默生成调研报告放在 Workspace 里。我当时不一定有时间看,但想看的时候它就在那。
长期积累下来,我会有一堆调研报告。等哪天有时间真想干点什么,我就问它:我有这么多调研报告,你觉得从哪件开始最有希望?
更有意思的是,有时候让它记录或调研某个东西,它翻到了我之前已经调研过或记录过的内容,然后说这两件事有关联,可以一起做。
这让我不同的点子之间形成了碰撞,我自己可能根本想不到还能这样。AI 仿佛成了带有我的记忆的另一个大脑。
模型的选择至关重要
很多人用 OpenClaw 觉得不好用,经常不听使唤,费钱,还不如免费的豆包等 App。
很重要的一个原因可能是选择的模型不行。
国产模型的使用体验
我刚开始用的就是国产模型,因为便宜。想体验一下,不想花太多钱。
之前我提到,让 OpenClaw 每次创建子任务时,把子任务放后台执行,告诉我给子任务的提示词是什么,而不是一直等着。
把这个规则告诉它之后,发现它根本不遵守。 我说”你没有遵守规则”,它说”抱歉,我知道错了,xxx”。然后马上继续犯同样的错。
当时我在想是不是不能这样指定。还去学了 OpenClaw 的使用技巧,手动编辑了 MEMORY.md 文件,把规则写进去,但依然不生效。偶尔发现它突然又按规矩执行了。
还有一次,我明确说在某个文件夹里有个文件,帮我改一下。因为是语音输入,文件夹名字大小写格式可能不标准。结果这个模型死活找不到文件,甚至说要帮我创建一个,非常离谱。
我用这个国产模型驱动的 OpenClaw 一天,老是出错。有些问题本来自己解决也没那么麻烦,用它反而更累,要一直纠正错误,但它屡教不改,总是低于预期。
当时心里给 OpenClaw 一个比较普通的评价:能用,但没什么惊艳的,吹得这么火不过如此。
顶级模型的使用体验
刚好有朋友分享了可以低成本用 Claude Opus 4.6 的渠道,换成 Claude 模型之后,突然发现一切都不一样了,有时候甚至会被震惊到。
1、换了模型之后,明显更遵守我写的规则了。虽然不是百分百成功,但提高了很多,偶尔犯点小错我也能容忍。
2、凌晨 3 点给它发消息说要调研什么东西,它不仅完全按我设置的方式操作了,没出错,还顺便提醒我说已经三点了,该睡觉了,它会帮我调研,明天起来再看结果就行。
本来我在认真思考问题,但 AI 在专业地解决问题的同时,还能给我一点人文关怀,提醒我睡觉。现有的工作 APP 是做不到的,除非你自己去设置提醒。
3、还有前面说的灵感碰撞。我让它调研某个 APP 的可行性,结果调研报告里说这个 APP 可以和我另一个想法结合。AI 能在很短的时间看完我所有文档,把我这些混乱的想法碎片拼起来。
这也是我现在把自己多年笔记全部放到 OpenClaw workspace 的原因。近几年我的笔记已经全部迁移成本地 Markdown 文件格式了。
关于我近几年的笔记管理方式,23 年写过一篇文章:
4、时不时能给我一些超预期的结果。例如我没有明确要求写完代码要做测试,但它主动做了测试验证。
现在你们能看懂网上的这个梗图了:
小结
近期写代码、写文档的事情上,我也分别尝试了国产模型和国外模型。实际体感就是国产模型和国外模型差距还是有的,有很大进步空间。
我先后尝试了多个国产模型,发现这些模型的问题在于智商不稳定,有时候他们也能很好地解决问题,有时候又陷入了一些错误的逻辑里出不来。
和别人交流时,我提到 OpenClaw 经常忽略 MEMORY.md 规则,有人说这是上下文管理问题,不是大模型的问题。我对技术原理理解不深,但在没做任何修改、也没额外增加提示词的情况下,一切换模型,智商马上就有明显变化。
所以条件允许的话,非常建议用最好的模型。目前公认最强的大模型是”御三家”:Claude、Google Gemini 和 OpenAI GPT。国产模型整体还是落后一些,希望早日追赶上来。
出于经济、使用门槛等原因,也可以混合使用不同模型。常规聊天用便宜的国产模型,写代码或复杂逻辑分析用贵的 Claude 之类。让 OpenClaw 开子任务时,明确告诉它用什么模型。
下图是文本和代码领域的大模型能力排行榜,截取自 https://arena.ai/leaderboard


AI 对软件行业的重构
网上有种观点:AI 大模型出来以后,软件行业会受到巨大冲击。
以后人更多的是直接跟 AI 交互,很多软件可能就不需要了。
从我用 OpenClaw 这件事,也能初步体会到这个趋势。比如我会用 OpenClaw 记笔记、记待办、开发简单软件。
在我的 workspace 网站里,可以看到很多子目录:
1、AI 调研生成的研究资料。
2、AI 帮我记录的待办事项。
3、AI 帮我开发的小游戏和软件项目。当检测到某个文件夹里有 index.html,右侧会出现三角形按钮,点击就能直接运行网页。
要说明的是,目前我只通过 OpenClaw 开发简单的游戏和软件,有些可能是简单原型,有些可能是纯娱乐。复杂的软件还是需要用常规的 AI Coding 工具开发,中间涉及大量和 AI 的交互,很可能需要我研究代码实现。
4、多年来的笔记和博客也放在这里了。这些笔记可以在其他笔记软件里编辑,对 AI 来说是可读的。必要时,让 AI 直接从笔记里搜索信息、寻找灵感。

以前每件事都需要找相应软件来实现。但有了 OpenClaw,有些功能可以被 AI 取代,我只需要跟 AI 聊天就行。
而就在我正写这篇文章的时候,看到 Claude 又要发布新版本了,很激进,Claude 马上就可以操纵整个电脑设备了,用户直接跟 Claude 语言交互就可以了。
不过我认为,即使以后和 AI 语音交互的场景越来越多,但我们通过传统 UI 界面操作手机的方式也不会消失。
人的视觉里的信息量比语音的信息量要大得多,而且有些场合下使用语音不方便,打字也不如点击按钮效率高。比如我想刷短视频作为娱乐,总不可能让 AI 描述给我听吧,肯定还是要去看的。
不过我觉得,传统 App 以后或许会变成内嵌到 AI 系统里的插件,在需要的时候自动调取出来。
AI 重构软件行业的阻力
目前很多应用软件只有图形界面,是设计给人类用的,AI 操作起来效率低下。但已经有一些企业和开源项目在努力了。
比如我看到的这些项目:
Peekaboo 给 AI 提供了在 Mac 系统中查看和操作图形界面的接口。实际测试过,配置好相关权限后,AI 可以截屏 Mac mini 桌面发给我。
https://github.com/steipete/Peekaboo
CLI-Anything 让 AI 自己阅读开源软件代码,生成方便 AI 调用的接口,可以完整操作这些软件。可惜只能处理开源软件,而我们用到的很多商业软件都是闭源的,没法用这种方式,只能等厂商自己实现类似接口。
https://github.com/HKUDS/CLI-Anything
谷歌提出的 WebMCP 协议,目标是让所有网站都提供一套方便 AI 访问的接口,这样 AI 可以直接从网站抓数据,不用像人类一样去访问网站。
https://developer.chrome.com/blog/webmcp-epp
但这些都是初步尝试,不是很成熟。它们有个共同问题:未来的软件到底往什么方向发展?如果 AI 可以直接和软件交互,不需要人类参与的图形界面了,现有网站软件的盈利模式都需要重新设计。
现在很多网站软件依赖人类看广告的方式盈利,对爬虫、机器人做屏蔽,防止数据被批量复制走,甚至我们用 AI 搜索数据时也会遇到这种反制措施,拿不到数据。以后 AI 大规模普及,这些网站就不得不思考新的盈利模式了。
随着 AI 的进步,我认为未来技术上 AI 有能力取代很多软件的功能,但一定会有很多来自人类社会的阻力。
前面说的反爬虫措施、各种软件的盈利模式、闭源商业软件的封闭模式,都会导致 AI 操作这些软件网站效率低下。而且太多软件需要重新开发,这需要时间。
成本与未来的普及
便宜模型效果不好,顶级模型又太贵。所以现阶段用 AI,特别是 OpenClaw 这种消耗 Token 比较多的产品,是有点痛苦的。
但把时间拉长看,这个问题总能解决。模型会越来越先进,随便选一个市面上的模型都能达到好用的状态。Token 价格也会越来越便宜,普通人也能负担得起。
现阶段很多事情没有被 AI 取代,跟成本和模型智能程度有很大关系,但这些更多是工程优化问题,而不是可行性问题。假以时日,相信能逐步解决。
有个类似的事:视频早在互联网早期就有了,但短视频这几年才真正火起来。
原因很简单,以前的手机电脑配置差,摄影设备效果也不行。电脑播放视频需要好性能,分辨率和屏幕也不怎么样。还有个重要因素是以前网络速度慢,听歌都可能卡,看在线视频经常要缓冲,刷短视频就更不用想了。
但随着基础设施逐渐进步,达到一定阈值后,短视频突然就火起来了,对社会产生了深远影响。
过年回家发现爸妈很少看电视了,无聊就刷短视频看直播。我爸喜欢看短剧,甚至眼神不太好、不太会用手机的八十多岁奶奶,也学会刷红果短剧了。
同样的道理,如果以后大模型准确程度越来越高,Token 越来越便宜,达到一定阈值,AI 软件就会像短视频一样无处不在,给社会带来巨大改变。
总结
很多人装了 OpenClaw,觉得没使用场景,觉得不过如此,经常不听使唤等等。其实一开始我也是这么想的。
但后来花了更多精力和钱折腾 OpenClaw 之后,尤其是尝试了先进的 Claude 大模型,逐渐感受到了它在特定场景下的优点。
现阶段国产大模型能力相比国外还有差距;国外大模型价格贵,对中国用户也不太友好。用这些 AI 工具,确实有些让人心累。
折腾 OpenClaw 的过程中,为了解决它的一些问题,我也更好地理解了一些 AI 相关技术知识,比如 Web Search、上下文等等。
在一定程度上,它甚至让我更清晰的看到了 AI 的未来趋势。OpenClaw 一定不是这一轮 AI 大模型技术的最终形态,但它一定是 AI 发展过程中重要的进步。
这篇文章就到这里。下一篇我会从另一个角度思考 AI,分享对 AI 能力边界和局限性的理解,并且讨论为什么我认为 OpenClaw 被过度炒作了。感兴趣可以保持关注。
原创不易,如果你觉得这篇文章有帮助,欢迎分享转发。
夜雨聆风