AI每日资讯 - Google IO发了一堆东西,但没人搞得清该用哪个

一句话总结

本期回顾谷歌AI战略演变，分析其从分散到整合的历程及编码智能体时代的新挑战。

核心要点

•谷歌AI战略曾因分散而落后，后通过整合DeepMind等举措逐步追赶。

•2023年I/O推出Bard，但表现平平，Gemini初期发布也令人失望。

•2024年谷歌通过AI Overviews等产品试水，但早期效果不佳。

•NotebookLM的音频概览功能成为意外亮点，广受好评。

•2025年谷歌推出VO3等模型，Gemini用户数接近ChatGPT。

•编码智能体兴起，谷歌在工具集和代理领域再次面临落后风险。

行业新闻

Karpathy加入Anthropic

前OpenAI联合创始人Andrej Karpathy宣布加入Anthropic。对很多AI观察者来说，这比Google IO台上发布的任何东西都重要。节目主持人预告明天单独做一期。

主题深度讨论：Google IO——战略越来越乱，但这可能不影响结果

背景：Google的AI过山车

Google的生成式AI之路堪称跌宕。2014年收购DeepMind时领先所有人，但ChatGPT发布时措手不及——因为AI战略分散在多个团队。2023年的Bard是追赶之作，体验像微软的产品。2024年初Gemini图像生成闹出"纳粹制服穿在日本女性身上"的荒唐事故；AI Overviews建议用户"在披萨上涂胶水"。但2024年下半年靠NotebookLM的音频概述功能扳回一局。2025年凭Nano Banana系列在图像编辑领域开辟了全新品类。

进入2026年，编码Agent和Harness成为主战场——而这恰好是Google最弱的地方。Claude Code和Codex统治了开发者心智，Google被甩在后面。

IO的核心发布：很多东西，但不太清楚加起来是什么

Omni——表面看是视频模型，实际定位是"任何输入到任何输出"的多模态模型家族。初始反应一般（"以为是VO 4，结果是Gemini Omni"），但当人们开始尝试视频编辑功能后态度转变——把白天变成跨年夜、保持镜头结构不变地换场景、换服装、隐藏人物。节目主持人认为：我们往往高估基础模型升级的意义，低估可控性提升的价值。但"这到底是给谁用的"Google没回答清楚。

Spark——被描述为"24/7个人Agent"。The Verge称之为"Google版Open CLAW"，但给出的示例全是消费者场景（帮你给老板写状态更新邮件、帮小企业盯收件箱）。不是Claude Code的竞品，也不完全是消费者产品，定位模糊。而且只说"今年夏天上线"，连具体日期都没有。

Anti-Gravity 2.0——独立桌面应用，从头重建，多Agent团队、计划任务、原生语音、与Google产品集成。这是正面对标Codex和Claude Code的。为展示能力，他们用93个子Agent、数十亿token在12小时内重建了一个操作系统的核心框架。但演示视频第二分钟屏幕上出现了Codex的文件夹——尴尬至极。Codex团队的Tbo直接嘲讽："Anti-Gravity团队是没有设计师吗？" 社区评价：有进步，进入了同一档次，但没有任何人认为它超越了Claude Code或Codex。

Gemini 3.5 Flash——没有PRO版（说稍后推出），只有Flash。跑分上已经是Google最强模型（Terminal-bench 76.2%超过Opus 4.7），但不是全面SOTA。速度约为3.1 PRO的3倍。问题出在成本和效率：比上一代Flash贵3倍，比两年前的Flash贵20倍。跑基准测试消耗的token是GPT-5.5 Medium的3.5倍。Theo直接崩溃发了一条crash out视频展示它在实际Agent任务上有多糟糕。Tommy Bruce的评价更刺耳："输出速度很快但完全不重要，因为它在每个任务上都爆发出大量无意义的工具调用。卡住了也不停下来问你，就一直瞎撞。代码质量是Sonnet水平。"

Google同时宣布Ultra计划从250美元降到200美元，新增100美元档位——但Agent工具改为按用量计费。和所有人一样，补贴在收回。

社区反应两极分化

一派：产品太乱了。 Simon Smith："我的头在转。求求OpenAI和Anthropic，别搞成这样——给我一个强大的单一工具就行。我不想纠结该用Spark还是Anti-Gravity还是AI Studio还是Flow。" Nathan Clark的神吐槽列举了十几个产品名之间的混乱关系，结尾是"总之一切都非常简单"。

二派：可能不重要。 Gemini App月活从去年5月的4亿跳到今年4月的9亿。月处理token从480万亿跳到3.2千万亿。OpenAI主动让出消费者市场去打企业，Google可能不需要产品线清晰——只需要在每个用户已经在使用的Google界面里塞入"恰好够用的AI"。Peter Yang："Google要赢消费者AI了——它是唯一同时做视频模型的美国实验室，消费者爱视频。"

更深层的战略分裂

DeepMind CEO Hassabis相信AGI需要世界模型、持续学习和物理世界连接（机器人），对OpenAI和Anthropic押注"编码Agent→自动化AI研究→递归自改进"的路线持怀疑态度。但Sergey Brin据报组建了一支"突击队"追求AI自改进——这恰好是Anthropic和OpenAI的路线。两条路线能同时追吗？在算力越来越紧张的世界里，这是一个真实的资源分配问题。

节目主持人的判断

不是看空Google。Anti-Gravity有进步；3.5 Flash在没有PRO版的情况下无法最终定论；Spark是一个值得探索的不同方向。但问题是：在2025年下半年好不容易聚焦起来的战略，在这次IO上又开始出现产品散乱和优先级分裂的迹象。接下来要观察的是Anti-Gravity 2.0和Spark实际上线后的表现，以及3.5 PRO到底什么时候来。

提到的产品/技术

•Gemini

•ChatGPT

•Claude Code

•NotebookLM

•DeepMind

•Bard

•VO3

•Kodexs

对 Vibe Coder 的启发

关注编码智能体与知识工作代理的融合趋势，尽早布局相关工具链。

🎧 扫码收听音频版

扫描下方二维码，收听完整音频 & 查看原文

觉得有用？点个在看和关注支持一下