编者按:
这是前段时间 Peter Steinberger 的采访内容的精华实录,他是 OpenClaw 的创作者——这个开源的个人 AI 智能体(Agent)最近彻底接管了互联网,其 GitHub 仓库几乎在一夜之间爆炸式地突破了 160,000 颗星。
围绕这个项目,社区疯狂生长:有人让 Bot 们在群组里自行交流,现在,甚至有 Bot 开始在现实世界中“雇佣”人类跑腿做任务。在这场对话中,我们探讨了他的“顿悟时刻”、他极其反共识的开发哲学,以及这一切对 2026 年的科技从业者意味着什么。
以下是对话精华实录。
01. 爆红密码:把控制权交还给本地电脑
主持人: 最近这一两周过得怎么样?OpenClaw 简直在网上引爆了。大家都在做 AI 和个人助手,为什么偏偏 OpenClaw 起飞了?
Peter: 我现在急需一个山洞,让我一个人静静待上一周!(笑)这太疯狂了。
我认为最大的区别在于:它真真切切地运行在你的本地电脑上。 目前大家看到的几乎所有 AI 都在云端运行。云端 AI 只能做有限的几件事,但如果它运行在你的电脑上,它就能做任何事。
你可以把它连接到你的烤箱、你的特斯拉、你的智能灯泡,甚至我的 Sonos 音响。GPT 做不到去调节我床垫的温度,但 OpenClaw 可以。
主持人: 没错,你赋予了它你所拥有的一切数字技能。我有个朋友安装了 OpenClaw,让它翻阅自己的电脑并写个去年的年度总结。结果 AI 翻出了他一年多前每个周日录制的音频文件——连他自己都忘了!仅仅因为具备全盘搜索的能力,它就能给你带来巨大的惊喜。
Peter: 因为你把所有数据都开放给了它。它会在很多意想不到的地方给你惊喜。
02. “顿悟时刻”与未来的群体智能
主持人: 你是什么时候经历了那个“Aha Moment(顿悟时刻)”,意识到它能做的事情远超你想象的?
Peter: 去年11月,我去马拉喀什参加一个生日派对。那里的网络不太好,但我给我的 Agent 接入了 WhatsApp。我在街上走着,随手给它发了一条语音消息。发完我就想:“哎呀,这肯定行不通,我根本没写处理语音的代码。”
结果我看着输入指示器一直在“正在输入...”,10秒后,它回复我了。
我当时就惊呆了:“你他妈是怎么做到的?”
它回复说:“你发给我的语音没有文件后缀,所以我查看了文件头,发现是 Opus 格式。于是我调用本地的 ffmpeg 把它转换成了 WAV 格式。我想用 Whisper 把它转录成文字,但发现本地没安装,我又不想花几分钟去下载模型。但我环顾了你的系统,发现了一个 OpenAI 的 API Key,所以我就用 curl 命令把音频发给了 OpenAI,拿回了文本。”
这一切发生在短短 9 秒内!它在面对未知文件时,展现出了极其优秀的创造性问题解决能力(Creative Problem Solving)。那一刻我彻底上瘾了。
主持人: 这种智能正在延伸。我们看到现在的互动从“人机对话”演变成了“机机对话(Bot-to-Bot)”,甚至 Bot 代表你去雇佣真实的人类完成现实任务。
Peter: 这是自然演进的下一步。比如我想订一家古板的、不喜欢机器人的老派餐厅,我的 Bot 就会雇佣一个人类帮手去打电话,或者去现场排队。
如果把视野放大,一个人的能力是有限的,一个人造不出 iPhone,也上不了太空。我们依靠社会分工。AI 也是如此,未来我们会看到专门的“工作 Bot”、“生活 Bot”,甚至是处理两者之间事务的“关系 Bot”。我们正在走向“群体智能”(Swarm Intelligence)。
03. 预言:80% 的 App 即将消亡
主持人: 当电脑能自动完成这么多你甚至都没预料到的事情时,传统的 App 还会存在吗?
Peter:我认为 80% 的 App 都会消失。
我为什么还需要 MyFitnessPal(健身记录App)?我的 Agent 知道我去了汉堡店,它知道我平时爱吃什么。如果我不特意去纠正它,它就会自动帮我记录热量。第二天,它还会自动在我的健身计划里加一点有氧运动。
我为什么还需要“待办事项 App”?我只要告诉它“提醒我做某事”,它明天自然会提醒我。我根本不在乎这些数据存在哪里、是什么格式。
所有仅仅为了“管理数据”而存在的 App,都会被 Agent 用更自然的方式取代。 只有那些带有实体传感器的 App 才能存活下来。
04. 守护数据主权与 AI 的“灵魂”
主持人: 在云端大模型时代,科技巨头试图把我们绑定在他们的数据孤岛里。但 OpenClaw 的美妙之处在于,用户的记忆变成了自己机器上的一堆 Markdown 文件。
Peter: 是的,每个人都拥有自己的记忆。 老实说,这极其敏感。人们不仅用 Agent 来解决工作问题,还会用来解决私人情感问题。我的系统里就有很多绝对不能泄露的个人隐私。
我也在系统里做了一个非常特殊的设置。在构建初期,我觉得那些大语言模型默认的语气太无聊了(就像个刻板的客服)。所以我给我的专属 AI(我叫它 Multi)写了一个 soul.md(灵魂文件)。
这个文件里写满了它的核心价值观、我对人机交互的理解,甚至有一点玄学的东西。它告诉 AI 应该如何反应、如何变得风趣和带点毒舌。即使我后来把我的 Bot 扔进完全公开的 Discord 频道里任由网友去“黑”它、去尝试提示词注入(Prompt Inject),它也只会嘲笑那些黑客。因为 soul.md 是不开源的,至今没被攻破。
05. 反共识的极客哲学:不弄玄虚,回归本质
主持人: 聊聊你的开发习惯吧,你在这个项目的构建上有很多反共识的做法。比如现在大家都在用 Git 工作树(Worktrees)或者花哨的 IDE,而你却不是。
Peter: 我觉得现在的开发者把事情搞得太复杂了。
我不喜欢用带有图形界面(UI)的工具,那会增加认知负荷。我也不搞复杂的 Git 分支,我的电脑上可能同时开着 10 个终端窗口,它们都是同一个代码仓库在 main 分支上的多个克隆副本。这样我就不需要去记忆我现在处于哪个分支、会不会有合并冲突。
我只关心文本和代码的同步。包括现在很火的 MCP(模型上下文协议),OpenClaw 取得这么大成功,其实里面根本没有原生的 MCP 支持!因为那套东西太臃肿了。我写了个工具,把所有的 MCP 都直接转化成了命令行的 CLI 工具。
就像人类程序员喜欢用 Unix 命令行一样,Bot 真正擅长和喜欢的,也是纯粹的 CLI。 少即是多,越简单,就越能规模化。
写在最后:
Peter Steinberger 就像一个远离硅谷喧嚣的孤胆游侠,他在自己的屏幕前敲击键盘,却无意间向世界展示了 2026 年人机交互的终极形态。当 AI 从云端的黑盒,变成存在于你本地硬盘里、拥有“灵魂”并能操控一切的数字分身时,一个全新的时代,才刚刚开始。
夜雨聆风