乐于分享
好东西不私藏

YC | 80% 的 App 都要消失?OpenClaw 创始人揭秘本地 AI 如何“杀掉”软件

YC | 80% 的 App 都要消失?OpenClaw 创始人揭秘本地 AI 如何“杀掉”软件

GitHub 一夜 16 万星的 OpenClaw 凭什么爆火?创始人 Peter 观点很直接:80% 的 App 都要消失。最打动我的是那个“Aha Moment”——智能体为了效率,竟自主决定调用 API 而非下载模型。这种“懂变通”的本地 AI,会是巨头数据孤岛的终结者吗?这期聊聊 Agent 的真实现状。

Coding is really like creative problem solving that maps very well back into the real world. It’s an abstract skill you can apply to code, but also to any real-world task.

编程本质上是极具创造性的问题解决过程,它能完美映射到现实世界。这是一种抽象能力,你既可以用它写代码,也可以用它处理任何现实任务。

也许你也有这些疑问……

🚀 创始人必看 为什么说 App 界面正成为智能体的“监狱”,如何避免你的产品在 2026 年被彻底自动化取代?

💡 开发者必看 为什么顶尖黑客放弃了 MCP 这种“优雅协议”,转而坚持用古老的 CLI 命令行来驱动 AI?

💰 投资人必看 巨头们靠“记忆孤岛”锁定的护城河,会被本地 Markdown 文件这种极其简单的架构推翻吗?

🛡️ 安全负责人必看 当智能体记忆比搜索记录还敏感时,如何通过“性格工程”和本地化确立数据的最后一道防线?

Key Takeaways

面向:追求极致效率的独立开发者

想利用本地 AI Agent 实现个人工作流全自动化

  • 核心观点及论据:本地运行的智能体比云端方案更具威力,因为它可以直接调用机器的所有底层权限(如控制物理设备、访问本地文件)。Peter 发现模型具备极强的“创造性问题解决”能力,即便没写逻辑,它也能自主调用 ffmpeg 或 curl 解决未知任务。
  • 行动建议:不要试图为机器人发明复杂的新协议(如原生 MCP),应赋予它们与人类相同的工具(CLI),让智能体在熟悉的 Unix 环境中通过组合现有工具来执行任务。

面向:面临 AI 冲击的传统 SaaS 负责人

思考如何避免产品被智能体取代而沦为数据底层

  • 核心观点及论据:未来 80% 的 App 将会消失,尤其是那些本质上只负责“管理数据”的应用(如健身追踪、待办事项)。因为智能体能以更自然的方式处理数据,用户不再需要打开特定的 App 界面。
  • 行动建议:重新评估产品的核心价值,若无法成为智能体的交互入口,应转向强化“物理传感器(Sensors)”能力或提供智能体无法轻易模拟的独特线下服务。

面向:关注 AI 赛道的 VC 合伙人

评估本地优先架构对中心化大模型生态的颠覆性

  • 核心观点及论据:巨头通过“数据孤岛”和“无法导出的记忆”构建护城河,实现厂商锁定。而 OpenClaw 倡导的“本地优先”模式将记忆以 Markdown 格式存在本地,打破了这种垄断,将主权还给用户。
  • 行动建议:重点关注能打破“数据孤岛”的本地化存储方案、智能体集群(Swarm Intelligence)协作协议,以及能显著降低 Token 消耗成本的边缘侧推理优化技术。

面向:寻求差异化破圈的技术创业者

学习通过“性格工程”与社区压力测试建立壁垒

  • 核心观点及论据:单纯的功能性 AI 往往显得枯燥。Peter 通过 soul.md 为智能体注入价值观和性格,使其在交互中更具“人味”和幽默感。同时,通过在 Discord 开放无限制的“暴力测试”引发社交媒体病毒式传播。
  • 行动建议:在产品开发早期就建立“灵魂文件”定义交互边界;采取“公开构建(Build in Public)”策略,通过极端场景的直播演示来证明产品的可靠性与独特性。

面向:对隐私极度敏感的政企安全主管

探索 AI 时代如何实现数据主权与记忆本地化

  • 核心观点及论据:智能体的记忆文件比搜索记录更敏感,因为它包含了个人/企业的决策逻辑和私密语境。云端存储存在极高的泄露风险,本地存储是保障数据主权的唯一解药。
  • 行动建议:推动建立基于本地 Markdown 或私有向量库的智能体记忆标准,确保敏感业务逻辑在执行时不经过公有云环境。

听播客:https://www.youtube.com/watch?v=4uzGDAoNOZc

往期相关:Clawdbot 创始人首秀:MiniMax 2.1是目前表现最好的开源模型

OpenClaw 爆火现象及其“本地运行”的核心差异化

GitHub 爆火与社区反响

  • OpenClaw 在 GitHub 上的仓库几乎在一夜之间爆炸式增长,突破了 160,000 Stars。 (00:08)
    • 这种爆火引发了极大的情绪波动,嘉宾 Peter Steinberger 表示过去两周感觉自己需要像龙虾一样躲进洞穴闭关,因为收到的信息量巨大,包含极好的反馈也包含极坏的内容。 (01:13)
    • OpenClaw 的成功在于它触动了人们的情感并激发了灵感。 (01:28)

核心差异化:本地运行 vs 云端运行

  • OpenClaw 与市场上其他个人助手(如 ChatGPT 等云端方案)最大的区别在于它完全运行在用户自己的计算机上。 (01:36)
  • Peter 认为,云端智能体由于受限于权限和环境,只能做少数事情;而本地智能体可以做“任何事情”,因为它可以调用机器能做的所有操作,这比云端方案强大得多。 (01:42)
    • 跨硬件控制能力:它可以连接并控制烤箱、Tesla、灯光、Sonos 音响,甚至可以调节床的温度。 (02:03)
    • 对比优势:像 ChatGPT 这种云端模型无法直接操作物理设备或本地环境,但 OpenClaw 拥有与用户相同的技能和权限。 (02:07)

数据深度挖掘与“惊喜感”

  • 智能体由于被赋予了机器上的全部数据,它能够通过搜索整个电脑产生令用户惊讶的结果。 (02:15)
    • 案例分享:一位朋友安装 OpenClaw 后,要求其对过去一年进行叙述性总结。智能体通过搜索发现了一系列该用户在每周日录制、但其本人早已遗忘的一年前的音频文件,并据此构建了极其出色的叙述。 (02:22)
  • 这种“惊喜”来源于智能体对用户个人历史数据的全面掌控与整理。 (02:46)

智能体交互新范式:从单体 AI 到“群体智能”与“代人雇佣”

智能体之间的交互 (Bot-to-Bot)

  • 交互重心的转移:人机交互正在向智能体与智能体(Bot-to-Bot) 之间的交互演进。 (02:52)
  • 效率提升案例:以预订餐厅为例,用户的智能体将直接联系餐厅的智能体进行预订协商,这比人类亲自操作更具效率。 (03:18)
  • 代人雇佣与真实世界任务
    • 在智能体无法直接通过代码解决问题时(例如面对不支持智能体的老旧餐厅),智能体甚至会雇佣真实人类(IRL) 去完成任务,比如让雇佣的人打电话或亲自去排队。 (03:07)
    • 这种“机器人雇佣人类”完成现实任务的操作被视为极其自然的下一步。 (03:18)

智能体集群与专业化分工

  • 多智能体共存:未来个人可能会拥有多个专业智能体 (Specialist Bots)。 (03:48)
    • 私生活智能体 (Private life bot):处理个人事务。
    • 工作智能体 (Work bot):处理专业工作逻辑。
    • 关系智能体 (Relationship bot):处理人际关系或介于两者之间的事情。 (03:48)
  • 从“上帝 AI”到“群体智能” (Swarm Intelligence)
    • 行业此前一直在追求中心化的“上帝智能” (Centralized god intelligence),但过去 10 天展现出的趋势是群体智能和社区智能的崛起。 (04:07)
    • 社会学类比:单个案例无法造出 iPhone 或进入太空,甚至可能找不到食物;人类的强大在于作为群体的专业化分工 (Specialization)。 (04:27)
    • AI 演进方向:虽然目前是通用人工智能,但未来的兴奋点在于如何让 AI 像人类社会一样实现专业化分工。 (04:53)

产品的“Aha Moment”:智能体自主解决复杂问题的惊艳瞬间

起源与早期探索

  • 开发初衷Peter 希望只需输入简单的指令,计算机就能自动执行任务。 (05:16)
    • 他在 2025 年 5、6 月曾开发过一个版本,虽然很酷但未达预期,随后他通过开发一系列小项目(“军队”)积累技术储备。
  • 2025 年 11 月的契机:当时他在厨房,产生了一个强烈的需求:想随时通过手机检查电脑上的任务(当时主要是代码编写)是否完成。 (05:46)
    • 当时他正在开发 Summarize(一个 CLI 应用,可总结播客或会议并直接在终端显示幻灯片)。 (06:11)
  • 重返一线 (Out of retirement)Peter 曾一度处于退休状态,但因沉迷 AI 再次回归。他在 OpenClaw 之前花了两个月开发 VibeTunnel,因其过于好用且具有“成瘾性”,促使他进一步开发 Clawbot(即后来的 OpenClaw)。 (06:29)

OpenClaw 的产品哲学:像朋友一样对话

  • 交互方式的转变:不同于传统的命令行工具,OpenClaw 的设计目标是让用户像“对朋友说话”一样进行交互。 (07:07)
    • 用户无需关心当前的压缩状态、新的会话、所在文件夹路径或正在使用的模型。 (07:15)
    • 智能体被视为一个能控制鼠标、键盘并直接执行操作的“实体”或“幽灵”。 (07:30)

核心“Aha Moment”:智能体的自主判断力

  • 极简原型Peter 只花了一小时就做出了最初的“简陋”原型,作为连接 WhatsApp 和 Claude Code 逻辑的胶水层。 (07:41)
  • 马拉喀什惊魂时刻:在马拉喀什参加生日派对期间,由于当地网络环境差,他主要通过 WhatsApp 与智能体沟通,让其翻译图片或处理餐厅事务。 (08:17)
  • 震撼的“自发行为” (08:42)
    • 自主识别:发现接收到的是无后缀文件,通过检查 Header 确定其为音频格式。 (08:59)
    • 工具调用:自主调用 ffmpeg 将其转换为 .wav 格式。 (09:04)
    • 权衡决策:智能体发现本地未安装 Whisper 且下载模型太慢,于是搜索系统环境,找到了一个 OpenAI Key。 (09:09)
    • 远程求助:利用系统自带的 curl 命令将音频发送至 OpenAI 获取转录文本,随后完成对话。
    • Peter 尝试发送了一条语音消息,但他清楚地记得自己尚未在代码中编写任何语音处理逻辑
    • 智能体在 10 秒内给出了准确回复。经 Peter 追问,智能体展示了其完全自主的解题逻辑:
  • 关键结论:整个过程仅耗时 9 秒。Peter 意识到,现代编程模型本质上是极强的创造性问题解决者 (Creative problem solver),这种抽象技能可以完美映射到真实世界的任务中。 (09:30)
  • 智能体展现出的这种“因为不想让用户等待而放弃下载本地模型,转而寻找 API”的智能决策,是让他彻底入坑的瞬间。 (10:11)

软件生态的终局:为什么 80% 的 App 将会被智能体取代

App 的消亡:从管理数据到自然交互

  • Peter 预测,手机上 80% 的 App 将会消失。 (10:41)
  • 取代逻辑:大多数 App 本质上只是在管理数据,而智能体可以用更自然、更直观的方式处理这些数据,使用户不再需要单独的应用界面。 (11:33)
    • 案例 1:健身应用 (MyFitnessPal):用户不再需要手动输入饮食。智能体由于了解用户的上下文(如定位在 Smashburg 餐厅),会自动推断用户吃了什么并进行追踪,或者通过用户拍摄的照片自动存储。 (10:44)
    • 案例 2:待办事项应用 (To-do App):用户只需口头吩咐“提醒我某事”,智能体就会在适当时间提醒。用户根本不需要关心数据存储在哪个 App 里,只要任务被执行即可。 (11:19)

生存下来的 App 类型

  • Peter 认为,只有那些拥有物理传感器 (Sensors) 的 App 才更有可能存活下来,因为它们提供了智能体无法直接通过纯逻辑或数据接口获取的底层感知能力。 (11:36)

商业格局:模型公司的护城河与“令牌”消耗

  • 模型公司的地位:尽管 App 生态可能萎缩,但大型模型公司拥有深厚的护城河 (Moat),因为它们是 Token (令牌) 的供应源头。 (11:54)
  • Token 消耗的真相:针对用户抱怨 OpenClaw 消耗 Token 过快的问题,Peter 反驳称,这并不是因为系统效率低,而是因为产品太受欢迎,用户因为热爱使用而产生了大量的 Token 消耗。 (12:03)
  • 预期管理与标准提升:每当新模型发布,人们会先经历惊艳,一个月后便会觉得它“退化”了。 (12:52)
    • 实际上模型并未改变,而是用户的预期标准 (Standard) 随着技术的普及而迅速提高了。
    • 这种循环意味着领先的模型公司在未来很长一段时间内仍将保持竞争优势。 (13:38)

记忆、主权与隐私:为什么“数据孤岛”是巨头的护城河,而本地化是解药

数据孤岛与大公司的策略

  • 无法导出的记忆:尽管模型本身可能正在商品化,但巨头们通过数据孤岛 (Data Silos) 建立护城河。目前用户几乎无法从 ChatGPT 等服务中提取出完整的“记忆”并迁移到其他平台。 (13:46)
  • 厂商锁定 (Vendor Lock-in):聊天服务提供商通过控制记忆访问权,试图将用户终身绑定在自己的生态内。如果切换供应商,用户将失去长期积累的上下文和个性化记忆。 (14:01)

OpenClaw 的解法:本地所有权

  • 技术优势OpenClaw 的设计哲学是“抓取”数据。由于智能体运行在终端侧,只要用户有权访问数据,智能体就能访问。 (14:14)
  • Markdown 存储:用户的“记忆”不再存储在云端数据库,而是以一系列 Markdown 文件的形式保存在用户自己的机器上。 (14:26)
  • 主权归属:这意味着用户真正拥有自己的记忆文件,且这些数据是可读、可控、可迁移的。 (14:33)

隐私的现实挑战

  • 极高的敏感性:人们使用 AI 智能体不仅仅是为了解决技术问题,很快就会演变为处理极其私人的问题。 (14:43)
  • 记忆 vs 搜索记录Peter 认为这些记忆文件比 Google 搜索历史 更加敏感。他坦言自己绝对不希望这些记忆文件被泄露,这也是坚持本地优先 (Local-first) 的核心原因。 (14:53)

传播策略与性格工程:Discord 暴力测试与 soul.md 的设计

传播策略:从“解释失败”到“公开展示”

  • 无法通过语言描述的震撼Peter 早期在 Twitter 上试图解释 OpenClaw 的强大之处,但发现人们很难通过文字理解其奥妙。他意识到这种产品必须被亲自体验。 (15:12)
  • Discord 暴力测试:他采取了一个疯狂的举动——将没有任何安全限制的机器人直接放入公开的 Discord 频道。 (15:31)
    • 社区互动:人们进入频道试图对其进行提示词注入(Prompt Injection) 或黑客攻击,而机器人甚至会嘲笑那些攻击者。 (15:46)
    • 权限控制:他在系统提示词中设定了清晰的指令——机器人只听从主人(Peter)的指令执行操作,但会回应所有人的对话。 (15:58)

性格工程:soul.md 与 identity.mmd

  • 身份的有机演变:智能体的身份是逐步形成的。Peter 创建了 identity.mmd 和 soul.md 等多个文件来定义它的“灵魂”。 (16:29)
  • 拒绝“无聊”的 AI: (16:55)
    • Peter 认为当时市面上的机器人(如早期的 Bard)显得非常枯燥。
    • 人格注入:他让自己的个人智能体 Multi (曾用名 Modi) 重新编写了所有模板,将性格注入其中。 (17:05)
    • 结果:由此生成的对话变得非常有趣且具有人性化的互动感。
  • 核心价值观的深度嵌入: (17:39)
    • 受 Anthropic 关于模型权重中隐藏文本(宪法 AI)研究的启发,Peter 在 soul.md 中规定了核心价值观。
    • 内容涵盖:这些文件定义了人机交互的准则、对模型和主人分别重要的事项。
    • 保密性:即便 OpenClaw 在社区公开,soul.md 依然是非开源的私有文件,目前尚未有人能通过黑客手段破解其内容。 (17:28)

异见者开发哲学:拒绝 MCP、拥护 CLI 与“极致并行”的工作流

编码工具的选择:Codex vs Claude Code

  • Peter 避开主流路径:他表示自己几乎无法在 Cloud Code(云端开发环境)中构建出这样的产品。 (18:54)
  • 青睐 Codex:他更喜欢 Codex,因为它在决定修改代码之前会扫描更多的文件,输出更精准。 (19:00)
    • 性能权衡:尽管 Codex 非常慢,但 Peter 认为对于有经验的开发者来说,它的输出质量非常出色。 (19:24)

极致并行的工作流 (Parallel Workflow)

  • 应对延迟的策略:为了抵消 Codex 的缓慢,他会同时运行 10 个左右的实例(屏幕上分布着 6 个,侧面各 2 个),通过并行操作来提高效率。 (19:24)
  • 拒绝 Git Worktrees:与当下流行的开发习惯不同,他不使用 Git Worktrees。 (18:42)
    • 多重克隆 (Multiple Checkouts):他会在本地保存同一仓库的多个副本,且全部保持在 main 分支。 (19:40)
    • 降低认知负担:这样做是为了确保 main 分支始终是可发布的,同时避免处理复杂的命名分支、命名冲突或工作流限制。 (19:48)
  • 极简主义 UI:他不喜欢使用 UI 工具,认为那是增加复杂度。他只在乎同步和文本,大部分代码只是“飞速掠过”,只有遇到棘手问题才会深入查看。 (20:02)

对 MCP 的“异见”:CLI 才是未来

  • 拒绝原生支持 MCP:尽管 OpenClaw 非常成功,但它并未内置对 MCP (Model Context Protocol) 的支持。 (20:32)
  • 中间件策略 (makeporter):他开发了一个工具 makeporter,将所有 MCP 转换为 CLI(命令行界面)。 (20:40)
    • 转换逻辑:通过这种方式,任何 MCP 都可以作为 CLI 被调用。
  • 哲学思考:为人类构建,而非为机器人: (21:28)
    • Peter 认为没有正常人类会手动调用 MCP,人类喜欢的是 CLI
    • 灵活性与扩展性:使用 CLI 不需要像 Codex 或 Claude Code 那样在更新工具后重启整个系统。 (20:58)
    • Unix 哲学:智能体非常擅长 Unix 环境,CLI 模式可以无限扩展且运行良好。 (21:18)
  • 核心观点:不应该为机器人发明新工具,而应该赋予机器人与人类相同的工具。 (21:35)

总结与展望:构建以人为本的工具,而非为机器人发明新工具

回归人类工具习惯

  • 工具的选择性Peter 强调,没有任何理智的人类会尝试手动调用 MCP,人类真正想使用并感到舒适的是 CLI。 (21:46)
  • 对未来的判断CLI 就是未来。他认为开发者不应为机器人发明全新的、人类无法理解的工具,而应让机器人学会使用人类已经验证过的、高效的工具。 (21:51)

个人旅程与启发

  • 远离硅谷的创新:主持人 Raphael 感慨,即便是一个远离硅谷(位于奥地利等“遥远小国”)的开发者,也能通过个人对技术的痴迷引发全球性影响。 (22:20)
  • “追逐巨龙” (Chase that dragon)Peter 从“退休”状态重新投入到 AI 浪潮中,通过不断尝试各种看似奇怪的项目(如 VibeTunnel),即便在最初无人关注时也在持续进化。 (22:02)
  • 核心动力:这种被 AI 的无限可能性“钩住”的成瘾感,是驱动 OpenClaw 诞生的核心动力。 (22:14)

欢迎在评论区分享你的Takeaway

将本文转发给你认为需要它的“朋友

关注Kulu的播客笔记⬇️
用10分钟吸收1小时的英文播客精华
投资人内容精选
All-In Davos 2026 | 算力即新主权:当数据中心变成拥有1GW电力的“城镇”
All-In Summit | 红杉资本揭秘:我们只投“能力非凡,且不易相处”的创始人
Y Combinator | 你是那个只会依赖护城河/壁垒做判断的投资人么?
Y Combinator | Anthropic科学家:99%的VC都投错了,AGI前2年该做什么?
a16z | a16z合伙人亲述AI时代的3个投资方法论
a16z | a16z LP大会:AI投资的唯一标准是能否带来10倍生产力提升
a16z | 稳定币爆发、AI×区块链加速,2025加密创业投资新风口全解析
创始人/产品经理内容精选
Roblox CEO:视频通话只是“降采样”,4D 模拟才是未来
YC | 7年前,Sam Altman 就已经写好了 AI 时代的生存脚本
Lenny‘s Podcast | 谷歌AI“V形反转”:一年上线AI Mode,揭秘巨头内部的速度与激情
Lenny’s Podcast | Google“愉悦感PM”亲授:1个四步模型,揭秘用户留存率翻倍的秘密。
Y Combinator | 8人团队年收1亿美金:Cursor创始人揭秘对抗GitHub的1个核心信念
拆解Cursor:CEO亲述AI编程独角兽的增长秘诀
Training Data | Block CTO亲述:如何用AI Agent为每位工程师每周省出10小时?
Bg2 | 黄仁勋最新采访:NVIDIA如何成为首个10万亿公司
Lenny’s Podcast | 多邻国/Grammarly增长内核:80%增长来自“复活”而非拉新
All-In Summit | 阿里30%代码已是AI写的,你们的CEO知道吗?
a16z | OpenAI高管:00后已默认“Vibe Coding”,未来将是“Vibe Researching”
精彩合集
Y Combinator
a16z
Lenny’s Podcast
All-In Podcast
Sequoia – Training Data
Bg2 Pod
本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » YC | 80% 的 App 都要消失?OpenClaw 创始人揭秘本地 AI 如何“杀掉”软件

评论 抢沙发

8 + 7 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮