一句话总结
本期回顾谷歌AI战略演变,分析其从分散到整合的历程及编码智能体时代的新挑战。
核心要点
•谷歌AI战略曾因分散而落后,后通过整合DeepMind等举措逐步追赶。
•2023年I/O推出Bard,但表现平平,Gemini初期发布也令人失望。
•2024年谷歌通过AI Overviews等产品试水,但早期效果不佳。
•NotebookLM的音频概览功能成为意外亮点,广受好评。
•2025年谷歌推出VO3等模型,Gemini用户数接近ChatGPT。
•编码智能体兴起,谷歌在工具集和代理领域再次面临落后风险。
行业新闻
Karpathy加入Anthropic
前OpenAI联合创始人Andrej Karpathy宣布加入Anthropic。对很多AI观察者来说,这比Google IO台上发布的任何东西都重要。节目主持人预告明天单独做一期。
主题深度讨论:Google IO——战略越来越乱,但这可能不影响结果
背景:Google的AI过山车
Google的生成式AI之路堪称跌宕。2014年收购DeepMind时领先所有人,但ChatGPT发布时措手不及——因为AI战略分散在多个团队。2023年的Bard是追赶之作,体验像微软的产品。2024年初Gemini图像生成闹出"纳粹制服穿在日本女性身上"的荒唐事故;AI Overviews建议用户"在披萨上涂胶水"。但2024年下半年靠NotebookLM的音频概述功能扳回一局。2025年凭Nano Banana系列在图像编辑领域开辟了全新品类。
进入2026年,编码Agent和Harness成为主战场——而这恰好是Google最弱的地方。Claude Code和Codex统治了开发者心智,Google被甩在后面。
IO的核心发布:很多东西,但不太清楚加起来是什么
Omni——表面看是视频模型,实际定位是"任何输入到任何输出"的多模态模型家族。初始反应一般("以为是VO 4,结果是Gemini Omni"),但当人们开始尝试视频编辑功能后态度转变——把白天变成跨年夜、保持镜头结构不变地换场景、换服装、隐藏人物。节目主持人认为:我们往往高估基础模型升级的意义,低估可控性提升的价值。但"这到底是给谁用的"Google没回答清楚。
Spark——被描述为"24/7个人Agent"。The Verge称之为"Google版Open CLAW",但给出的示例全是消费者场景(帮你给老板写状态更新邮件、帮小企业盯收件箱)。不是Claude Code的竞品,也不完全是消费者产品,定位模糊。而且只说"今年夏天上线",连具体日期都没有。
Anti-Gravity 2.0——独立桌面应用,从头重建,多Agent团队、计划任务、原生语音、与Google产品集成。这是正面对标Codex和Claude Code的。为展示能力,他们用93个子Agent、数十亿token在12小时内重建了一个操作系统的核心框架。但演示视频第二分钟屏幕上出现了Codex的文件夹——尴尬至极。Codex团队的Tbo直接嘲讽:"Anti-Gravity团队是没有设计师吗?" 社区评价:有进步,进入了同一档次,但没有任何人认为它超越了Claude Code或Codex。
Gemini 3.5 Flash——没有PRO版(说稍后推出),只有Flash。跑分上已经是Google最强模型(Terminal-bench 76.2%超过Opus 4.7),但不是全面SOTA。速度约为3.1 PRO的3倍。问题出在成本和效率:比上一代Flash贵3倍,比两年前的Flash贵20倍。跑基准测试消耗的token是GPT-5.5 Medium的3.5倍。Theo直接崩溃发了一条crash out视频展示它在实际Agent任务上有多糟糕。Tommy Bruce的评价更刺耳:"输出速度很快但完全不重要,因为它在每个任务上都爆发出大量无意义的工具调用。卡住了也不停下来问你,就一直瞎撞。代码质量是Sonnet水平。"
Google同时宣布Ultra计划从250美元降到200美元,新增100美元档位——但Agent工具改为按用量计费。和所有人一样,补贴在收回。
社区反应两极分化
一派:产品太乱了。 Simon Smith:"我的头在转。求求OpenAI和Anthropic,别搞成这样——给我一个强大的单一工具就行。我不想纠结该用Spark还是Anti-Gravity还是AI Studio还是Flow。" Nathan Clark的神吐槽列举了十几个产品名之间的混乱关系,结尾是"总之一切都非常简单"。
二派:可能不重要。 Gemini App月活从去年5月的4亿跳到今年4月的9亿。月处理token从480万亿跳到3.2千万亿。OpenAI主动让出消费者市场去打企业,Google可能不需要产品线清晰——只需要在每个用户已经在使用的Google界面里塞入"恰好够用的AI"。Peter Yang:"Google要赢消费者AI了——它是唯一同时做视频模型的美国实验室,消费者爱视频。"
更深层的战略分裂
DeepMind CEO Hassabis相信AGI需要世界模型、持续学习和物理世界连接(机器人),对OpenAI和Anthropic押注"编码Agent→自动化AI研究→递归自改进"的路线持怀疑态度。但Sergey Brin据报组建了一支"突击队"追求AI自改进——这恰好是Anthropic和OpenAI的路线。两条路线能同时追吗?在算力越来越紧张的世界里,这是一个真实的资源分配问题。
节目主持人的判断
不是看空Google。Anti-Gravity有进步;3.5 Flash在没有PRO版的情况下无法最终定论;Spark是一个值得探索的不同方向。但问题是:在2025年下半年好不容易聚焦起来的战略,在这次IO上又开始出现产品散乱和优先级分裂的迹象。接下来要观察的是Anti-Gravity 2.0和Spark实际上线后的表现,以及3.5 PRO到底什么时候来。
提到的产品/技术
•Gemini
•ChatGPT
•Claude Code
•NotebookLM
•DeepMind
•Bard
•VO3
•Kodexs
对 Vibe Coder 的启发
关注编码智能体与知识工作代理的融合趋势,尽早布局相关工具链。
🎧 扫码收听音频版
扫描下方二维码,收听完整音频 & 查看原文

觉得有用?点个 在看 和 关注 支持一下
夜雨聆风