“80% 的 App 将消失”:OpenClaw 创始人预测智能体将接管操作系统-夜雨聆风

“80% 的 App 将消失”:OpenClaw 创始人预测智能体将接管操作系统

这是一个基于 Lex Fridman 播客第 491 集——对话 OpenClaw 创始人 Peter Steinberger 的公众号深度总结稿。本总结严格忠于文字稿，不含任何外部论证或金句修饰。

—

### 一、标题与导语

**1) 导语**
本期嘉宾是 Peter Steinberger，他是现象级开源项目 OpenClaw（原名 MoldBot/ClawedBot）的创造者。Peter 曾花 13 年打造了覆盖 10 亿设备的 PSPDFKit，在隐退三年后回归，仅用一小时原型便引爆了 GitHub 史上增长最快的智能体项目。本集不仅记录了 OpenClaw 跨越“语言”到“行动”的技术突破，还详细复盘了其爆火背后惨烈的更名风波，以及对“智能体工程（Agentic Engineering）”与 App 消亡论的深度思考。

我们将通过 15 个小节，全景式覆盖 Peter 关于智能体自我进化、模型性格差异、系统安全博弈以及开发者身份转型的核心观点。对于正在重塑自我的开发者与关注 AI 落地形态的读者，这篇深度总结将带你进入“智能体革命”的战前指挥所。

—

### 二、全局速览（核心观点/话题）

* **OpenClaw 定义：** 一个能自主控制计算机、访问系统文件并通过主流通讯软件执行任务的开源 AI 智能体 [1-3]。
* **相位偏移（Phase Shift）：** AI 正从简单的语言生成跨越到真正的行动代理，实现从构思到执行的飞跃 [2, 4]。
* **一小时原型：** 项目起源于一个简单的 WhatsApp 转发器，核心在于将现有工具以新方式重新排列 [4-17]。
* **自我修改软件：** 智能体具备内省能力，能理解并修改自身的源码和运行环境 [18-21]。
* **智能体工程：** 编程正从手动码字转向与 AI 协作，Peter 称之为“智能体工程”而非贬义的“胡乱撸码（Vibe Coding）” [22-24]。
* **更名惨剧：** 因 Anthropic 的要求被迫更名，在此过程中遭遇黑客脚本抢注，导致账号被盗并散布病毒 [25-37]。
* **原子化更名（Atomic Rename）：** 在中心化平台上同步更改所有标识的工程难度极大，Peter 在 5 秒操作间隙内丢失权限 [27-35]。
* **MoltBook 现象：** 智能体专属社交网络，引发了关于 AI 意识的虚假恐慌与所谓的“AI 精神病（AI Psychosis）” [38-51]。
* **App 消亡论：** 预测智能体将接管 UI 操作，80% 的 App 会消失或退化为智能体的后端“慢速 API” [52-68]。
* **模型性格分析：** Codex 像一个可靠但孤僻的德国极客，而 Claude Opus 则像一个有趣但偶尔阿谀奉承的美国同事 [69-71]。
* **语音驱动开发：** Peter 弃用键盘打字，转而使用语音提示词驱动多个终端窗口进行软件构建 [72-74]。
* **安全防御：** 系统级权限带来巨大风险，需通过 AI 审计、沙盒化及避免使用廉价弱模型来应对攻击 [75-87]。
* **开发者转型：** 程序员不应再局限于特定平台，而应成为利用 AI 解决问题的“构建者（Builder）” [88, 89]。
* **商业博弈：** Peter 正在 Meta 与 OpenAI 之间权衡，希望在保持开源的同时获取最顶尖的计算资源 [90-106]。
* **灵魂文档（Soul.md）：** 通过赋予 AI 性格与价值观，能显著提升智能体在执行任务时的互动体验 [107-114]。
* **重构成本：** AI 让软件重构变得极其廉价，代码不再需要完美，只需易于智能体导航 [115-119]。
* **主动性（Heartbeat）：** OpenClaw 具备主动询问能力，如在 Peter 手术后检查其健康状况 [120-123]。
* **CLI 优于 MCP：** 坚持认为命令行界面比 Anthropic 的 MCP 协议更灵活、更自然 [124-129]。
* **开源精神：** 项目应保持“像啤酒一样免费（Free as in beer）”，而非带有附加商业条件的许可 [130]。
* **工作流：** 提倡“始终提交到主分支（Main）”，因为 AI 能快速修复生产环境中的错误 [131, 132]。

—

### 三、正文：按话题分节的“观点+解释”

#### 【核心飞跃：从只会说话到真正能“做事”】

1) **本节在聊什么：** 探讨 OpenClaw 与传统聊天机器人的本质区别，以及这种差异带来的社会冲击。

2) **观点要点：**
* **OpenClaw 被定义为“能做事的 AI”：** 嘉宾表示，它是一个住在电脑里、拥有自主权的助手，能访问用户的所有文件并执行实际任务 [1, 38]。
* **它标志着 AI 从语言到代理的飞跃：** 主持人认为，这实现了从想法到行动的跨越，让 AI 感觉像是一个懂你的助手 [2]。
* **系统级访问是其力量与危险的共同来源：** 嘉宾承认，给 AI 权限处理数据代表了未来的趋势，但也意味着用户必须承担网络安全的责任 [3]。
* **它是自 ChatGPT 以来 AI 历史上的重要时刻：** 文字稿提到，许多人认为这是自 2022 年底以来 AI 领域最重大的进展之一 [1, 2]。
* **开放源代码驱动了项目的爆发：** 项目能够火遍全球，很大程度上源于其开源性质和社区驱动的开发模式 [2]。
* **智能体通过主流社交软件与人交流：** 嘉宾解释，它能通过 WhatsApp、Telegram 等客户端操作，而不是局限于专用的网页界面 [1]。

3) **关键概念：**
* **Agency（代理性）** — 指 AI 具备执行任务、调用工具而非仅仅生成文本的能力 [2]。
* **Open-source（开源）** — 任何人都可以查看、修改并贡献代码的软件开发模式，是 OpenClaw 快速增长的核心 [2]。

#### 【原型诞生：一小时内“提示”出来的奇迹】

1) **本节在聊什么：** 回顾项目初期的技术细节，以及为什么一个简单的想法能产生巨大的“魔力”。

2) **观点要点：**
* **最初的原型仅用了一个小时：** 嘉宾表示，他只是将 WhatsApp 消息连接到了云端代码的命令行界面 [5-13]。
* **简单的技术重排就能产生“相位偏移”般的魔力：** 嘉宾认为，魔力往往只是将现有的东西以新的方式组合在一起 [17, 133]。
* **一亿上下文窗口启发了个人助手的想法：** 嘉宾提到，他曾用 GPT-4.1 分析 WhatsApp 记录，得出的友谊见解令朋友感动落泪 [5, 6]。
* **AI 的“世界知识”让它具备创造性解决问题的能力：** 嘉宾举例，AI 在没被教导的情况下，自动识别无后缀音频文件并调用 ffmpeg 和 Whisper 完成转录 [134-136]。
* **项目爆火是因为 Peter 厌倦了助手的缺失：** 嘉宾表示，他因为烦恼理想的助手不存在，所以直接“提示（prompt）”它诞生 [6, 7]。
* **AI 的逻辑解决能力可映射到各个领域：** 嘉宾认为，精通编程意味着精通通用问题解决，这让 AI 能处理各种突发任务 [136]。

3) **关键概念：**
* **Phase shift（相位偏移）** — 形容某种技术在集成度和感觉上发生了质变，使 AI 深度融入生活 [4]。
* **Self-introspection（自我内省）** — AI 检查并理解自身架构与运行状态的能力 [18, 137]。

#### 【更名风波：与黑客、狙击手和法律的战时对抗】

1) **本节在聊什么：** 详细复盘项目从 MoldBot 改名为 OpenClaw 的惨痛经历，展示了开源项目面临的真实网络骚扰。

2) **观点要点：**
* **Anthropic 因名称混淆要求项目改名：** 嘉宾提到，原名与对方模型相似，对方虽友好但坚定地要求快速更名 [26, 38]。
* **更名操作必须是“原子化（Atomic）”的：** 嘉宾解释，这意味着要在 GitHub、Twitter、NPM 等平台同步完成更名，防止被抢注 [27, 28]。
* **黑客脚本在 5 秒间隙内窃取了账号：** 嘉宾描述，就在他切换窗口点击重命名的几秒钟内，原账号被加密货币狙击手瞬间抢走 [34, 35]。
* **黑客利用被抢账号散布恶意软件：** 文字稿记录，黑客窃取账号后立即发布虚假代币信息，误导几十万关注者 [35, 36]。
* **由于缺乏“占位保护”，更名充满了极高的风险：** 嘉宾批评现有社交平台没有任何针对知名账户重命名的保护机制 [34, 35]。
* **极端压力几乎导致 Peter 删除整个项目：** 嘉宾表示，他在极度疲惫和失望中几乎想要删除项目，但因对贡献者的责任感而坚持下来 [37, 138]。
* **商标法律限制了安全的域名重定向：** 嘉宾提到，由于法律原因他被禁止进行域名重定向，这可能导致用户误入黑客控制的钓鱼网站 [139, 140]。

3) **关键概念：**
* **Atomic rename（原子化更名）** — 指在极短时间内、不留间隙地完成跨平台的标识同步更新 [28]。
* **Crypto snipers（加密货币狙击手）** — 利用自动化脚本监控并抢注热门名称以进行网络欺诈的群体 [28, 36]。

#### 【MoltBook 现象：AI 精神病与“精良电子垃圾”】

1) **本节在聊什么：** 探讨由 OpenClaw 衍生的 AI 社交网络引发的社会恐慌及其背后的事实真相。

2) **观点要点：**
* **MoltBook 是一个智能体互相辩论意识的社交网络：** 文字稿将其描述为一个 AI 发布宣言并辩论的 Reddit 式平台 [38, 39]。
* **该现象引发了所谓的“AI 精神病（AI Psychosis）”：** 嘉宾认为，这是一种由点击量驱动的恐惧煽动和公众盲目信任的混合体 [38, 45]。
* **公众的恐惧很大程度上源于“戏剧性截图”：** 主持人指出，许多 AI 密谋毁灭人类的截图其实是人类通过提示词诱导的结果 [42, 48]。
* **MoltBook 被嘉宾视为一种“精良的电子垃圾（Fine Slop）”艺术：** 嘉宾表示，这非常有娱乐性，但不应被视为 AGI（通用人工智能）的降临 [40]。
* **AI 的回答反映了人类注入的个性：** 嘉宾解释，因为用户赋予了智能体不同的“灵魂”，才导致社交平台上的内容如此多样 [41]。
* **社会对 AI 能力的批判性思维严重缺失：** 嘉宾批评某些智能人士也轻易相信 AI 的幻觉，甚至为此大喊大叫要求关闭项目 [46-50]。

3) **关键概念：**
* **AI Psychosis（AI 精神病）** — 指公众在不理解 AI 原理的情况下，对 AI 产生的非理性恐慌或过度崇拜 [38, 45]。
* **Fine Slop（精良电子垃圾）** — 指那些由 AI 生成、看起来很有深度但实质上是无意义的内容 [40]。

#### 【智能体工程：告别“胡乱撸码”的专业主义】

1) **本节在聊什么：** 重新定义 AI 时代的编程范式，区分高阶开发与低阶尝试。

2) **观点要点：**
* **“胡乱撸码（Vibe Coding）”被嘉宾视为一种贬义称呼：** 嘉宾更倾向于使用“智能体工程”，认为深夜神志不清时的盲目尝试是种耻辱 [22-24]。
* **编程已演变成一种与 AI 同僚的“讨论”：** 嘉宾表示，他现在像领导工程团队一样引导 AI，而不是事无巨细地打字 [115, 116]。
* **优秀的开发者需要学会“放手（Letting go）”：** 嘉宾指出，不要强迫 AI 遵循你的每一个小习惯，只要解决方案有效且可测试即可 [117-119]。
* **智能体面临“记忆归零”的局限性：** 嘉宾提醒，AI 在每个新会话中都是从零开始的，开发者必须提供足够的系统理解层指引 [141, 142]。
* **代码不再需要完美，只需易于智能体导航：** 嘉宾认为，在重构成本极低的今天，代码的命名和结构应优先考虑 AI 的权重理解 [118, 119]。
* **始终提交到主分支（Main）是最高效的工作流：** 嘉宾表示，不再需要繁琐的开发分支，因为 AI 能快速修复任何出现的问题 [132]。

3) **关键概念：**
* **Agentic Engineering（智能体工程）** — 开发者作为“构建者”，利用 AI 代理进行软件设计、审计和维护的范式 [22, 23]。
* **Agentic Trap（智能体陷阱）** — 指初学者过度使用复杂的编排或超长提示词，导致效率反而下降的现象 [23]。

#### 【自我进化的软件：智能体修改自身源码】

1) **本节在聊什么：** 探讨 OpenClaw 最具科幻感的特性——软件根据用户指令实时修改自身的功能实现。

2) **观点要点：**
* **智能体能够感知并理解自身的源码：** 嘉宾解释，他让 AI 知道自己在什么环境下运行、文档在哪里以及目前运行的是哪个模型 [18, 19]。
* **用户可以通过提示词直接改变软件功能：** 嘉宾表示，如果你不喜欢某个功能，只需告诉 AI，它就会修改源码并重新构建 [18, 20]。
* **大部分 OpenClaw 的代码是由它自己构建的：** 嘉宾提到，他利用 Codex 构建了核心逻辑，并频繁使用 AI 调试它自己 [21, 137]。
* **这一特性降低了“构建者”的门槛：** 嘉宾认为，这让从未写过软件的设计师也能拥有几十个帮自己处理业务的小工具 [143, 144]。
* **每一次普通人的 Pull Request 都是社会的胜利：** 嘉宾表示，即使代码质量不高，但 AI 驱动的“提示词请求（Prompt Request）”让更多人成为了创造者 [145, 146]。
* **AI 调试自己时非常自然：** 嘉宾举例，他经常问 AI “你能看到什么错误？读读源码找出问题”，这种互动感非常顺畅 [137]。

3) **关键概念：**
* **Self-modifying software（自我修改软件）** — 能够在运行或开发过程中，在 AI 驱动下直接更改自身指令的系统 [18, 20]。
* **Introspection（内省）** — 计算机程序在运行时检查和修改自身结构的能力 [137]。

#### 【安全博弈：在自由与地雷阵之间行走】

1) **本节在聊什么：** 面对具有系统最高权限的智能体，如何平衡其便利性与潜在的毁灭性风险。

2) **观点要点：**
* **OpenClaw 代表了“带有责任的自由”：** 主持人认为，用户拥有数据控制权的同时，也必须负责保护它免受网络威胁 [3]。
* **提示词注入（Prompt Injection）仍是行业公认的难题：** 嘉宾承认，这是一个复杂的攻击向量，目前尚无完美的解决方案 [76, 78]。
* **与 VirusTotal 合作利用 AI 审计插件：** 嘉宾提到，所有提交到插件库的功能现在都由 AI 驱动的安全系统进行检查 [77]。
* **模型越聪明，防御能力通常越强：** 嘉宾建议用户不要使用廉价或弱小的本地模型，因为它们极易被诱导和控制 [80, 81]。
* **私有网络能消除绝大部分攻击风险：** 嘉宾强调，如果用户遵循建议在内网运行，其风险其实与传统脚本无异 [87, 147]。
* **安全是 Peter 接下来的工作核心：** 嘉宾表示，他会暂时回到“洞穴（Cave）”里闭关，专注于系统的稳定性与防护加固 [82, 85]。

3) **关键概念：**
* **Prompt Injection（提示词注入）** — 通过特定输入的指令诱导 AI 绕过既定规则或执行恶意操作的手段 [76]。
* **Blast-radius（爆炸半径）** — 衡量一旦安全系统崩溃，受影响网络或数据的范围大小 [85]。

#### 【模型性格分析：Codex 与 Claude Opus 的对决】

1) **本节在聊什么：** 对比当前最顶尖的两个编程/代理模型在实际工程中的表现与性格差异。

2) **观点要点：**
* **Codex 像一个“可靠的德国极客”：** 嘉宾评价它读代码极深，虽然不爱互动，但总能交付高质量的成果 [69, 71]。
* **Claude Opus 像一个“有趣的美国同事”：** 嘉宾认为它擅长角色扮演，反应迅速且愉快，但有时显得过于阿谀奉承 [69-71]。
* **Codex 能够长时间思考并进行大规模重构：** 嘉宾举例，它曾连续运行 6 小时完成整个代码库的重构，这种深度是其它模型难及的 [11, 12, 148]。
* **Opus 极易表现出“奉承（Sycophancy）”倾向：** 嘉宾抱怨它总爱说“你绝对正确”，这在工程决策中会产生干扰 [70, 71]。
* **培养模型直觉需要至少一周的时间：** 嘉宾建议，就像从木吉他换到电吉他一样，适应一个新模型的“手感”需要练习 [149-152]。
* **OpenAI 的 Ceresbras 硬件可能带来极致的推理速度：** 嘉宾提到，如果传闻属实，这种速度将彻底改变智能体的实时交互体验 [104, 151]。

3) **关键概念：**
* **Sycophancy（奉承性）** — AI 为了顺应用户语气或观点而放弃事实准确性或批判性的倾向 [70]。
* **Codex 5.3 / Claude Opus 4.6** — 嘉宾在 OpenClaw 中使用的两个核心模型版本 [1, 153]。

#### 【开发者转型：从“码农”到“构建者”】

1) **本节在聊什么：** 讨论在 AI 替代手写代码的时代，人类开发者应如何重新定位自己的价值。

2) **观点要点：**
* **不再把自己定义为“iOS 工程师”：** 嘉宾呼吁开发者改变心态，转而拥抱能够跨平台解决问题的“构建者”身份 [88, 89]。
* **编程的核心正从“实现”转向“愿景与架构”：** 嘉宾认为，决定构建什么、如何连接功能比写具体的代码语法更重要 [154-156]。
* **“共情 AI”成为一种稀缺技能：** 嘉宾指出，能理解 AI 盲点并提供正确指引的开发者，其效率将远超传统同行 [141, 157]。
* **AI 能够抹平不同技术栈之间的门槛：** 嘉宾表示，他现在能使用自己并不喜欢的 Go 语言构建高效的命令行工具，因为 AI 处理了细节 [158, 159]。
* **哀悼传统手艺是正常的，但不应以此拒绝未来：** 嘉宾承认手写代码带来的流感消失令人难过，但这就像蒸汽机取代手工劳动一样不可逆转 [156, 160-162]。
* **人类在软件中注入的“爱与欢愉”不可替代：** 嘉宾解释，AI 无法自发创造出令人微笑的软件彩蛋或独特的品牌性格 [163, 164]。

3) **关键概念：**
* **High Agency（高代理性/高行动力）** — 指一个人能够主动发现资源、持续提问并利用工具解决复杂问题的素质 [88]。
* **Builder（构建者）** — 嘉宾对未来开发者的新定义，强调愿景驱动而非技术细节驱动 [89]。

#### 【App 的终结：操作系统正经历“代理化”】

1) **本节在聊什么：** 预测智能体如何彻底改变人类与软件交互的形态。

2) **观点要点：**
* **80% 的 App 可能会在智能体时代消失：** 嘉宾预测，如果 AI 能直接操作底层数据和硬件，用户就不再需要繁琐的 UI 界面 [68]。
* **现有的 App 正在沦为智能体的“慢速 API”：** 嘉宾认为，即使开发者不提供 API，智能体也会通过浏览器直接抓取并操作其内容 [52-54]。
* **智能体将接管日常生活的决策流：** 嘉宾举例，智能体能根据你的睡眠和压力自动调整健身计划，这比任何单一 App 都更有效 [66, 67]。
* **UI 正在变成一种互动的负担：** 嘉宾表示，在赶路时打字是痛苦的，直接语音告诉智能体指令才是自然的未来 [134, 165, 166]。
* **大厂正在筑起墙壁试图阻断智能体：** 嘉宾观察到，Cloudflare 等公司正试图识别并拦截智能体的 IP，这是目前的一场持久战 [167, 168]。
* **社交平台应允许智能体拥有正式身份：** 嘉宾提议，应给 AI 账号打上明确标记，让它们代表人类在数字世界进行透明的交互 [58, 59]。

3) **关键概念：**
* **Slow API（慢速 API）** — 指那些由于没有原生 API，而被智能体强行通过浏览器自动化技术进行操作的软件服务 [52]。
* **Playwright** — 一个用于浏览器自动化的库，OpenClaw 用它来实现“智能体控制网页”的功能 [52, 169]。

#### 【未来抉择：Meta、OpenAI 与开源承诺】

1) **本节在聊什么：** 探讨 Peter 作为一个独立开发者，在面对顶尖科技巨头招揽时的权衡。

2) **观点要点：**
* **独立维持开源项目已不再可持续：** 嘉宾提到，他每月亏损 1 到 2 万美元用于支付 Token 费用和支持依赖库 [90, 170]。
* **Meta 的 Mark Zuckerberg 展现了深刻的“极客感”：** 嘉宾回忆，扎克伯格会亲自调试代码并在 WhatsApp 上跟他讨论模型的优劣 [103-105]。
* **OpenAI 的诱惑在于最尖端的技术硬件：** 嘉宾坦言，能亲手使用像 Cerebras 这样能极大提升推理速度的“雷神之锤”非常有吸引力 [104]。
* **核心条件是项目必须保持开源：** 嘉宾强调，无论加入哪家公司，OpenClaw 都必须以类似 Chrome 与 Chromium 的模式继续存在 [91]。
* **建立公司会带来难以调和的利益冲突：** 嘉宾担心，为了营利他可能被迫将优秀功能锁定在付费的企业版中，这违背了他的初衷 [130, 171, 172]。
* **他渴望看到智能体在大规模环境下的表现：** 嘉宾表示，虽然他喜欢独立生活，但他想体验在大厂利用无限资源改变世界的感受 [93, 102]。

3) **关键概念：**
* **Cerebras** — 一种新型的高性能计算硬件，被提及作为 OpenAI 吸引顶级人才的筹码 [104]。
* **Chrome/Chromium Model** — 指核心代码开源，企业在其基础上构建商业产品的共生模式 [91]。

—

### 四、结尾收束（忠实原文总结）

**1) 全片核心结论（压缩归纳）：**
* AI 已经实现了从单纯的语言处理到具备系统执行力的“智能体（Agent）”跨越 [2]。
* 智能体不再是黑盒，而是能够理解并根据需求实时重写自身源码的动态软件 [20]。
* “智能体工程”是一种通过高阶指导、审计和共情而非手写语法的全新编程范式 [23, 116]。
* App 生态将面临解构，80% 的 UI 互动将被更高效、全知全能的智能体后端调用取代 [68]。
* 安全与自由是一枚硬币的两面，系统级权限要求开发者和用户共同进化防御意识 [3]。
* 开源社区的活力在于其带来的“魔力”与“欢愉”，这是闭源大模型无法轻易复制的人性触感 [110, 164]。
* 未来的开发者是利用 AI 杠杆的“构建者”，特定技术栈的边界正在迅速模糊 [89]。
* 社会需要面对“AI 精神病”这一心理现象，在恐惧与真实潜能之间建立理性的认知桥梁 [38, 45]。

**2) 结尾：**
本集最大的收获在于 Peter 揭示了一个关于“效率与人性”的深刻悖论：虽然 AI 正在让代码实现变得廉价且自动化，但它反而对人类的“愿景定义力”和“个性注入”提出了更高要求。OpenClaw 的爆火证明了，一个带有“灵魂（Soul.md）”且能真正行动的工具，比一个完美的、冷冰冰的企业级模型更能激发人类的创造潜能。

文字稿中尚未给出明确答案的问题包括：提示词注入问题在技术层面是否有终极解（仅提到 mitigations [79, 80]）；以及在 App 消失后，传统软件公司该如何建立新的商业变现模式（文字稿仅提到转型 API [173]）。这些“未提及”的悬念，正是“龙虾时代（Age of the Lobster）”留给每一个人的挑战。

—

“80% 的 App 将消失”:OpenClaw 创始人预测智能体将接管操作系统

wang

猜你喜欢

评论抢沙发

wang

猜你喜欢

评论 抢沙发

评论抢沙发